• 2022-10-29
    在自动驾驶中,AI需要不断地通过路面信息来调整开车的决策。这种处理模式适合用( )来训练出合理的策略。
    A: 弱化学习
    B: 监督学习
    C: 强化学习
    D: 非监督学
  • C

    内容

    • 0

      机器学习包括以下哪些类型? A: 监督式学习 B: 非监督学习 C: 强化学习 D: 弱化学习

    • 1

      以下选项中,通过接收奖励信号来改善行为,从而获得最优策略的 A: 监督学习 B: 无监督学习 C: 强化学习 D: 迁移学习

    • 2

      ( )是数据集中每个特征向量都有一个标记,使用标记的训练数据来推断一个功能的学习任务。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 半监督学习

    • 3

      下列关于强化学习的说法正确的是? 在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境|强化学习的概念是从Alphago战胜李世石之后才提出的|强化学习和有监督学习的过程相似,是“开环”的过程|强化学习属于无监督学习的一种,不需要有监督信息

    • 4

      在自动驾驶中,AI需要不断地通过路面