以下哪项陈述是正确的?选出所有正确项( )
A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。
B: 逻辑回归使用了Sigmoid激活函数
C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。
D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。
B: 逻辑回归使用了Sigmoid激活函数
C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。
D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
举一反三
- 以下哪项陈述是正确的?选出所有正确项( ) A: 在构建学习算法的第一个版本之前,花大量时间收集大量数据是一个好主意。 B: 逻辑回归使用了Sigmoid激活函数 C: 使用一个非常大的训练集使得模型不太可能过拟合训练数据。 D: 如果您的模型拟合训练集,那么获取更多数据可能会有帮助。
- 如果您的模型在训练数据上表现很好,但在新实例上泛化很差,会发生什么?您如何可能解决这个问题?[br][/br] 选择一个: A: 模型可能会过拟合训练数据,需要使用更复杂的算法。 B: 模型很可能是过拟合训练数据,所以我们应该使用更简单的算法。 C: 模型可能欠拟合训练数据,所以我们应该使用更简单的算法。 D: 模型很可能欠拟合训练数据,所以我们应该使用更复杂的算法。
- 如果模型在训练集上表现很好,在新的数据上表现很差,发生了什么? A: 模型很可能出现了过拟合(overfitting)。 B: 需要获取更多的训练数据 C: 用一个简单的模型或算法、减少所用的特征或参数、正则化模型 D: 减少训练数据中的噪音。
- 训练集是用于模型拟合的数据样本。
- 在模型训练的时候为什么要将数据集拆分成训练集和测试集?( ) A: 测试集与训练集数据不能有重复.防止过拟合 B: 需要划分测试集数据用来调参 C: 数据集太多.训练模型用不了这么多数据