在epsilon-greedy算法中，epsilon的值越大，采用随机动作的概率越（），采用当前Q函数值代表的最大动作概率越（） A: 大，大 B: 小，小 C: 小，大 D: 大，小 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-01

在epsilon-greedy算法中，epsilon的值越大，采用随机动作的概率越（），采用当前Q函数值代表的最大动作概率越（） A: 大，大 B: 小，小 C: 小，大 D: 大，小

在epsilon-greedy算法中，epsilon的值越大，采用随机动作的概率越（），采用当前Q函数值代表的最大动作概率越（）
A: 大，大
B: 小，小
C: 小，大
D: 大，小

答案：

查看

举一反三