中国大学MOOC: 批量梯度下降法(BGD)寻优路径相对比较平滑。
举一反三
- 下列哪些方法是梯度下降法的改进?() A: 批量梯度下降(Batchgradientdescent) B: 随机梯度下降(Stochasticgradientdescent) C: 小批量梯度下降(Mini-batchgradientdescent)
- 训练大规模数据集时,首选的梯度下降算法是__。A.以上没有区别,都可以B.小批量梯度下降法C.随机梯度下降法D.批量梯度下降法() A: 1 B: 2 C: 3 D: 4
- 下面关于梯度下降法描述正确的是 A: 梯度下降法作为机器学习中较常使用的优化算法,其有着三种不同的形式:批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent)以及小批量梯度下降(Mini-Batch Gradient Descent)。 B: 批量梯度下降法是最原始的形式,它是指在每一次迭代时使用所有样本来进行梯度的更新。 C: 随机梯度下降法不同于批量梯度下降,是每次迭代使用一个样本来对参数进行更新。 D: 小批量梯度下降法是对批量梯度下降以及随机梯度下降的一个折中办法。更新参数时使用一部分训练样本。一般将训练样本集分成若干个batch,每个batch包含m个样本。每次更新都利用一个batch的数据,而非整个训练集。
- 中国大学MOOC: 下面关于梯度下降法描述正确的是
- 假设你有一个非常大的训练集合,如下机器学习算法中,你觉着有哪些是能够使用map-reduce框架并能将训练集划分到多台机器上进行并行训练的() A: 逻辑斯特回归(LR),以及随机梯度下降(SGD) B: 线性回归及批量梯度下降(BGD) C: 神经网络及批量梯度下降(BGD) D: 针对单条样本进行训练的在线学习