机器学习是AlphaGo取胜的关键,AlphaGo结合了()的优势,通过训练形成一个策略网络,阿尔法狗团队从在线围棋对战平台KGS上获取了16万局人类棋手的对弈棋谱,并从中采样了3000万个样本作为训练样本。
A: 无监督学习和强化学习
B: 监督学习和强化学习
C: 半监督学习和强化学习
D: 强化学习
A: 无监督学习和强化学习
B: 监督学习和强化学习
C: 半监督学习和强化学习
D: 强化学习
B
举一反三
- 中国大学MOOC: 机器学习是AlphaGo取胜的关键,AlphaGo结合了()的优势,通过训练形成一个策略网络,阿尔法狗团队从在线围棋对战平台KGS上获取了16万局人类棋手的对弈棋谱,并从中采样了3000万个样本作为训练样本。
- AlphaGo结合了监督学习和强化学习的优势,通过训练形成一个策略网络,阿尔法狗团队从在线围棋对战平台KGS上获取了16万局人类棋手的对弈棋谱,并从中采样了3000万个样本作为训练样本。将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络对自我对弈进行预测,预测所有可行落子位置的结果
- 弱监督学习包括()三个典型的机器学习。 A: 半监督学习、迁移学习 B: 监督学习、迁移学习 C: 迁移学习和强化学习 D: 半监督学习、迁移学习和强化学习
- 机器学习一般可以分为监督学习、无监督学习、半监督学习和强化学习四类。
- 机器学习包括监督学习、无监督学习和强化学习。
内容
- 0
机器学习中使用的算法可分为()三类 A: 监督学习,无监督学习和强化学习 B: 监督学习,无监督学习和智能学习 C: 监督学习,控制学习和强化学习 D: 控制学习,无监督学习和智能学习
- 1
大多数BP神经网络的学习训练属于 A: 强化学习 B: 无监督学习 C: 监督学习 D: 半监督学习
- 2
按照学习方式,机器学习可以分为监督学习、无监督学习、半监督学习和强化学习等。在监督学习中,训练样本的标签信息是已知的,根据样本标签是连续还是离散,监督学习又可以分为回归和分类。
- 3
机器学习包括:( ) A: 无监督学习 B: 半监督学习 C: 监督学习 D: 强化学习
- 4
训练数据集必须全部标注的机器学习方法是 A: 监督学习 B: 无监督学习 C: 半监督学习 D: 强化学习