如果模型在训练集上表现很好,在新的数据上表现很差,发生了什么?
A: 模型很可能出现了过拟合(overfitting)。
B: 需要获取更多的训练数据
C: 用一个简单的模型或算法、减少所用的特征或参数、正则化模型
D: 减少训练数据中的噪音。
A: 模型很可能出现了过拟合(overfitting)。
B: 需要获取更多的训练数据
C: 用一个简单的模型或算法、减少所用的特征或参数、正则化模型
D: 减少训练数据中的噪音。
举一反三
- 如果您的模型在训练数据上表现很好,但在新实例上泛化很差,会发生什么?您如何可能解决这个问题?[br][/br] 选择一个: A: 模型可能会过拟合训练数据,需要使用更复杂的算法。 B: 模型很可能是过拟合训练数据,所以我们应该使用更简单的算法。 C: 模型可能欠拟合训练数据,所以我们应该使用更简单的算法。 D: 模型很可能欠拟合训练数据,所以我们应该使用更复杂的算法。
- 一个好的学习训练模型应该是?() A: 在训练时最小化错误率(提高在训练集上的准确率) B: 模型应该简单(防止过拟合) C: 将模型函数正则化 D: 可以利用已知的数据特性,例如稀疏、低秩等
- 下列哪种方法可以减小“过拟合”? A: 减少训练数据 B: L1正则化 C: L2正则化 D: 减小模型复杂度
- 在训练模型时要最小化损失函数,有可能出现过拟合的问题。以下哪项数据处理方式可以防止模型过拟合______。 A: 正则化 B: 归一化 C: 规范化 D: 标准化
- 避免欠拟合的方法是 A: 模型复杂度过低,不能很好的拟合所有的数据,训练误差大 B: 增加模型复杂度,如采用高阶模型(预测)或者引入更多特征(分类)等 C: 模型复杂度过高,训练数据过少,训练误差小,测试误差大 D: 降低模型复杂度,如加上正则惩罚项,如L1,L4,增加训练数据等