下面属于强化学习的是（）。 A: 两个变量之间的关系，一个变量的数量变化由另一个变量的数量变化所惟一确定，则这两个变量之间的关系称为强化学习。 B: 算法先少量给用户推荐各类文章，用户会选择其感兴趣的文章阅读，这就是对这类文章的一种奖励，算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。 C: 用户每读一篇文章，就给这篇新闻贴上分类标签，例如这篇新闻是军事新闻，下一篇新闻是经济新闻等；算法通过这些分类标签进行学习，获得分类模型；再有新的文章过来的时候，算法通过分类模型就可以给新的文章自动贴上标签了。 D: 用户经常阅读军事类和经济类的文章，算法就把和用户读过的文章相类似的文章推荐给你。

2022-05-26

下面属于强化学习的是（）。 A: 两个变量之间的关系，一个变量的数量变化由另一个变量的数量变化所惟一确定，则这两个变量之间的关系称为强化学习。 B: 算法先少量给用户推荐各类文章，用户会选择其感兴趣的文章阅读，这就是对这类文章的一种奖励，算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。 C: 用户每读一篇文章，就给这篇新闻贴上分类标签，例如这篇新闻是军事新闻，下一篇新闻是经济新闻等；算法通过这些分类标签进行学习，获得分类模型；再有新的文章过来的时候，算法通过分类模型就可以给新的文章自动贴上标签了。 D: 用户经常阅读军事类和经济类的文章，算法就把和用户读过的文章相类似的文章推荐给你。

下面属于强化学习的是（）。
A: 两个变量之间的关系，一个变量的数量变化由另一个变量的数量变化所惟一确定，则这两个变量之间的关系称为强化学习。
B: 算法先少量给用户推荐各类文章，用户会选择其感兴趣的文章阅读，这就是对这类文章的一种奖励，算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。
C: 用户每读一篇文章，就给这篇新闻贴上分类标签，例如这篇新闻是军事新闻，下一篇新闻是经济新闻等；算法通过这些分类标签进行学习，获得分类模型；再有新的文章过来的时候，算法通过分类模型就可以给新的文章自动贴上标签了。
D: 用户经常阅读军事类和经济类的文章，算法就把和用户读过的文章相类似的文章推荐给你。

答案：

B

举一反三

内容

0
算法先少量给用户推荐各类文章,用户会选择其感兴趣的文章阅读,这就是对这类文章的一种奖励,算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。该实例描述的机器学习方式是() A: 回归 B: 分类 C: 聚类 D: 强化学习
1
算法先少量给用户推荐各类文章，用户会选择其感兴趣的文章阅读，这就是对这类文章的一种奖励，算法会根据奖励情况构建用户可能会喜欢的文章的“知识图”。该实例描述的机器学习方式是（
2
用户经常阅读军事类和经济类的文章，算法就把和用户读过的文章相类似的文章推荐给你。实际上算法并不知道军事类或者经济类的标签，它只是把相似的文章聚集为一类。该实例描述的机器学习方式是()
3
用户经常阅读军事类和经济类的文章，算法就把和用户读过的文章相类似的文章推荐给你...集为一类。该实例描述的机器学习方式是（
4
以下关于强化学习说法正确的是? A: 强化学习又称为增强学习、加强学习、再励学习或激励学习，是一种从环境状态到行为映射的学习，目的是使动作从环境中获得的累积回报值最大； B: 强化学习属于无监督学习； C: 在向用户推荐新闻文章的任务中，强化学习会找到用户先前已经阅读过类似的文章并向他们推荐其一； D: 强化学习是机器学习分支之一，介于有监督学习和无监督学习之间。