AlphaGo通过什么预测当局面下的胜率?()
A: 监督学习策略网络
B: 强化学习策略网络
C: 蒙特卡洛树搜寻索算法
D: 价值网络
E: 支持向量机
A: 监督学习策略网络
B: 强化学习策略网络
C: 蒙特卡洛树搜寻索算法
D: 价值网络
E: 支持向量机
举一反三
- 基于深度学习的AlphaGo主要采用哪些关键技术()。 A: 行为网络 B: 策略网络 C: 视觉网络 D: 价值网络 E: 蒙特卡洛树搜索
- 基于深度学习的AlphaGo主要采用哪些关键技术()。 A: A行为网络 B: B策略网络 C: C视觉网络 D: D价值网络 E: E蒙特卡洛树搜索
- 根据新时代专业技术人员的机遇与挑战,基于深度学习的AlphaGo主要采用哪些关键技术() A: 行为网络 B: 策略网络 C: 视觉网络 D: 价值网络 E: 蒙特卡洛树搜索
- AlphaGo涉及的三个关键技术分别是()。 A: 策略网络 B: 价值网络 C: 蒙特卡洛树搜索 D: 决策网络
- AlphaGo框架中利用大量棋谱来训练深度卷积网络,得到策略网络,同时通过强化学习来提高策略网络的能力