以下哪项陈述是正确的?选出所有正确项( )
A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。
B: 逻辑回归使用了Sigmoid激活函数
C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。
D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。
B: 逻辑回归使用了Sigmoid激活函数
C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。
D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
B,C
举一反三
- 以下哪项陈述是正确的?选出所有正确项( ) A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。 B: 逻辑回归使用了Sigmoid激活函数 C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。 D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
- 如果您的模型在训练数据上表现很好,但在新实例上泛化很差,会发生什么?您如何可能解决这个问题?[br][/br] 选择一个: A: 模型可能会过拟合训练数据,需要使用更复杂的算法。 B: 模型很可能是过拟合训练数据,所以我们应该使用更简单的算法。 C: 模型可能欠拟合训练数据,所以我们应该使用更简单的算法。 D: 模型很可能欠拟合训练数据,所以我们应该使用更复杂的算法。
- 如果模型在训练集上表现很好,在新的数据上表现很差,发生了什么? A: 模型很可能出现了过拟合(overfitting)。 B: 需要获取更多的训练数据 C: 用一个简单的模型或算法、减少所用的特征或参数、正则化模型 D: 减少训练数据中的噪音。
- 训练集是用于模型拟合的数据样本。
- 在模型训练的时候为什么要将数据集拆分成训练集和测试集?( ) A: 测试集与训练集数据不能有重复.防止过拟合 B: 需要划分测试集数据用来调参 C: 数据集太多.训练模型用不了这么多数据
内容
- 0
在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为( )。 A: 欠拟合 B: 过拟合 C: 损失函数 D: 经验风险
- 1
一个好的学习训练模型应该是?() A: 在训练时最小化错误率(提高在训练集上的准确率) B: 模型应该简单(防止过拟合) C: 将模型函数正则化 D: 可以利用已知的数据特性,例如稀疏、低秩等
- 2
训练算法的目的就是要让模型拟合训练数据
- 3
在训练模型时要最小化损失函数,有可能出现过拟合的问题。以下哪项数据处理方式可以防止模型过拟合______。 A: 正则化 B: 归一化 C: 规范化 D: 标准化
- 4
过拟合是指模型的拟合曲线过于贴近训练数据的特征,但测试集上却较差。( )