• 2022-05-26
    下面属于强化学习的是( )。
    A: 两个变量之间的关系,一个变量的数量变化由另一个变 量的数量变化所惟一确定,则这两个变量之间的关系称为强化学习。
    B: 算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据 奖励情况构建用户可能会喜欢的文章的“知识图”。
    C: 用户每读一篇文章, 就给这篇新闻贴上分类标签,例如这篇新闻是军事新闻,下一篇新闻 是经济新闻等;算法通过这些分类标签进行学习,获得分类模型;再 有新的文章过来的时候,算法通过分类模型就可以给新的文章自动贴上标签了。
    D: 用户经常阅读军事类和经济类的文章,算法就把和用户读过的文章相类似的文章推荐给你。
  • B

    举一反三

    内容

    • 0

      算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。该实例描述的机器学习方式是() A: 回归 B: 分类 C: 聚类 D: 强化学习

    • 1

      算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。 该实例描述的机器学习方式是(

    • 2

      用户经常阅读军事类和经济类的文章,算 法就把和用户读过的文章相类似的文章推荐给你。实际上算法并不知道军事类或者经济类的标签,它只是把相似的文章聚集为一类。该实例描述的机器学习方式是()

    • 3

      用户经常阅读军事类和经济类的文章,算 法就把和用户读过的文章相类似的文章推荐给你...集为一类。该实例描述的机器学习方式是(

    • 4

      以下关于强化学习说法正确的是? A: 强化学习又称为增强学习、加强学习、再励学习或激励学习,是一种从环境状态到行为映射的学习,目的是使动作从环境中获得的累积回报值最大; B: 强化学习属于无监督学习; C: 在向用户推荐新闻文章的任务中,强化学习会找到用户先前已经阅读过类似的文章并向他们推荐其一; D: 强化学习是机器学习分支之一,介于有监督学习和无监督学习之间。