• 2022-06-05
    关于AlphaGo的架构,以下说法错误的是( )
    A: 整个架构分成两部分,一个通过于人类下棋得到,一个通过自学生成。
    B: 据说现在的AlphaGo已经完全抛弃了基于人类专家下棋经验的走棋网络只剩下了AlphaGo左右互博的强化学习部分。
    C: 首先构造一个深度的卷积神经网络(称为走棋网络),输入的是棋盘状态所构成的一张二维图片;输出的则是AlphaGo下一步的走法。
    D: 设计价值网的价值函数的方法不是让机器自己把这个函数学到。
  • 举一反三