Q-Learning是强化学习算法中基于价值函数（value-based）的一种算法，主要思想就是将State与Action构建成一张Q值表（Q-table）来存储Q值，然后根据Q值来选取能够获得最大收益的动作。 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-07

Q-Learning是强化学习算法中基于价值函数（value-based）的一种算法，主要思想就是将State与Action构建成一张Q值表（Q-table）来存储Q值，然后根据Q值来选取能够获得最大收益的动作。

Q-Learning是强化学习算法中基于价值函数（value-based）的一种算法，主要思想就是将State与Action构建成一张Q值表（Q-table）来存储Q值，然后根据Q值来选取能够获得最大收益的动作。

答案：

查看

举一反三