机器学习中的两个主要挑战为“欠拟合”和“过拟合”。其中“欠拟合”指的是选择的模型包含的参数过多,以至于该模型对于已知数据预测得很好,但是对于未知数据预测的很差,使得训练误差和测试误差之间的差距太大。
举一反三
- 关于过拟合和欠拟合的说法,错误的是() A: 过拟合是指模型可以很好的拟合训练样本,但是对训练样本的预测能力差。 B: 欠拟合是指模型不能很好的拟合训练样本,且对新数据的预测准确性也不好。 C: 可以用Precision、Recall、F1 、判断模型过/欠拟合。 D: 模型的过拟合和欠拟合是无法通过调整参数来改变的。
- 关于过拟合说法不正确的是 A: 如果一味追求提高对训练数据的预侧能力,所选模型的复杂度则往往会比真模型更高。 B: 过拟合是指学习时选择的模型所包含的参数过多,以致于出现该模型对己知数据预测得很好,但对未知数据预测很差的现象 C: 对训练数据的预侧能力较高,模型的复杂度一定较高 D: 解决过拟合现象的一种方法是正则化
- 模型对训练数据拟合好,测试数据拟合差的现象,叫做 A: 欠拟合 B: 过拟合 C: 测试拟合 D: 训练拟合
- 在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为( )。 A: 欠拟合 B: 过拟合 C: 损失函数 D: 经验风险
- 避免欠拟合的方法是 A: 模型复杂度过低,不能很好的拟合所有的数据,训练误差大 B: 增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等 C: 模型复杂度过高,训练数据过少,训练误差小,测试误差大 D: 降低模型复杂度,如加上正则惩罚项,如L1,L4,增加训练数据等