• 2022-05-30
    在采用机器学习算法对数据集进行训练时,数据集Mini-Batch 的大小通常优选为2个的幂,如 256 或 512。这样选择的原因是什么?()
    A: Mini-Batch 为偶数的时候,梯度下降算法训练的更快
    B: Mini-Batch 设为 2 的 幂,是为了符合 CPU、GPU 的内存要求,利于并行化处理
    C: 不使用偶数时,损失函数是不稳定的
    D: 以上说法都不对
  • 举一反三