在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为( )。
A: 欠拟合
B: 过拟合
C: 损失函数
D: 经验风险
A: 欠拟合
B: 过拟合
C: 损失函数
D: 经验风险
B
举一反三
- 在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为( )。 A: 欠拟合(under-fitting) B: 过拟合(over-fitting) C: 损失函数(loss function) D: 经验风险(empirical risk)
- 如果您的模型在训练数据上表现很好,但在新实例上泛化很差,会发生什么?您如何可能解决这个问题?[br][/br] 选择一个: A: 模型可能会过拟合训练数据,需要使用更复杂的算法。 B: 模型很可能是过拟合训练数据,所以我们应该使用更简单的算法。 C: 模型可能欠拟合训练数据,所以我们应该使用更简单的算法。 D: 模型很可能欠拟合训练数据,所以我们应该使用更复杂的算法。
- 如果模型学习的特征很少,容易造成训练误差很大,这种现象称为______。 A: 泛化 B: 鲁棒性 C: 欠拟合 D: 过拟合
- 模型对训练数据拟合好,测试数据拟合差的现象,叫做 A: 欠拟合 B: 过拟合 C: 测试拟合 D: 训练拟合
- 如果一个模型在测试集上偏差很大,方差很小,则说明该模型() A: 过拟合 B: 可能过拟合可能欠拟合 C: 刚好拟合 D: 欠拟合
内容
- 0
过拟合是指模型的拟合曲线过于贴近训练数据的特征,但测试集上却较差。( )
- 1
如果模型在训练集上表现很好,在新的数据上表现很差,发生了什么? A: 模型很可能出现了过拟合(overfitting)。 B: 需要获取更多的训练数据 C: 用一个简单的模型或算法、减少所用的特征或参数、正则化模型 D: 减少训练数据中的噪音。
- 2
过拟合是指模型不能在训练集上获得足够低的误差
- 3
在模型训练的时候为什么要将数据集拆分成训练集和测试集?( ) A: 测试集与训练集数据不能有重复.防止过拟合 B: 需要划分测试集数据用来调参 C: 数据集太多.训练模型用不了这么多数据
- 4
通常,在机器学习中造成“过拟合”的主要原因有( ) A: 所训练的模型过于复杂 B: 所训练的模型过于简单 C: 特征属性太多,但训练样本太少 D: 数据集的规模太大