Q-learning属于哪种算法
A: On-policy算法
B: Off-policy 算法
C: Model-based 算法
D: Value-based 算法
A: On-policy算法
B: Off-policy 算法
C: Model-based 算法
D: Value-based 算法
B
举一反三
- Sarsa与Q-learning的区别是? A: Sarsa是off-policy,而Q-learning是on-policy B: Sarsa是on-policy,而Q-learning是off-policy C: Q-learning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了 D: Q-learning是一种保守的算法,sarsa是一种贪婪勇敢的算法
- 中国大学MOOC: Q-learning属于哪种算法
- 下列哪种算法属于分类算法的范畴(). A: Apriori算法 B: k-means算法 C: kNN算法 D: FP-Growth算法
- 关于A3C算法说法正确的是 A: 使用了多个线程,每个线程对应了不同的探索方式 B: 需要使用经验池存储样本 C: A3C是off-policy的算法 D: A3C是on-policy的算法
- 下列哪种算法属于聚类算法的范畴(). A: Apriori算法 B: k-means算法 C: kNN算法 D: C4.5算法
内容
- 0
下列哪种算法属于特征选择算法()。 A: 套索算法 B: Boosting算法 C: 多变量决策树算法 D: k-means算法
- 1
下列哪种算法为路径规划算法?() A: A*算法 B: B*算法 C: C*算法 D: D*算法
- 2
可以采用policy gradient算法来设计一款围棋游戏。( )
- 3
RSA属于哪种算法()? A: 对称密码算法 B: 非对称密码算法 C: 都不属于
- 4
以下哪些算法属于无监督学习算法? A: 空间聚类 B: 主成分分析 C: Q—learning D: 支持向量机