在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越
举一反三
- 在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。 A: 大;小 B: 大;大 C: 小;小 D: 小;大
- 在epsilon-greedy算法中,epsilon的值越大,采用随机动作的概率越(),采用当前Q函数值代表的最大动作概率越() A: 大,大 B: 小,小 C: 小,大 D: 大,小
- 马尔科夫决策过程由哪几个元素来表示 A: 状态、动作、转移概率、策略、折扣因子 B: 状态、动作、转移概率、折扣因子、回报函数 C: 状态、动作、输入、输出、回报函数 D: 状态、动作、值、策略、回报函数
- 基尼值越大,表示数据纯度越低,也表示从样本空间中随机选取两个样本时这两个样本所属类别不一样的概率越大。
- 概率是表示事件发生可能性大小的数量指标,概率越接近1,发生的可能性越大;概率越接近0,发生的可能性越小。