强化学习时机器学习算法的一种，就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-15

强化学习时机器学习算法的一种，就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。

强化学习时机器学习算法的一种，就是程序或智能体（agent）通过与环境不断地进行交互学习完成从环境到动作的映射，学习的目标就是使累计回报最大化。

答案：

查看

举一反三