机器学习中的主要的挑战是什么?
A: 缺乏数据;
B: 数据质量差;
C: 没有代表性的数据;
D: 非信息性特征过多;
E: 过于简单的模型会欠拟合、过于复杂的模型会过拟合。
A: 缺乏数据;
B: 数据质量差;
C: 没有代表性的数据;
D: 非信息性特征过多;
E: 过于简单的模型会欠拟合、过于复杂的模型会过拟合。
举一反三
- 通常,在机器学习中造成“过拟合”的主要原因有( ) A: 所训练的模型过于复杂 B: 所训练的模型过于简单 C: 特征属性太多,但训练样本太少 D: 数据集的规模太大
- 如果您的模型在训练数据上表现很好,但在新实例上泛化很差,会发生什么?您如何可能解决这个问题?[br][/br] 选择一个: A: 模型可能会过拟合训练数据,需要使用更复杂的算法。 B: 模型很可能是过拟合训练数据,所以我们应该使用更简单的算法。 C: 模型可能欠拟合训练数据,所以我们应该使用更简单的算法。 D: 模型很可能欠拟合训练数据,所以我们应该使用更复杂的算法。
- 过拟合是指模型的拟合曲线过于贴近训练数据的特征,但测试集上却较差。( )
- 出现过拟合的原因有:(<br/>) A: 样本数据选取不合理 B: 样本噪声干扰大 C: 假设模型不合理,模型参数太多,过于复杂 D: 模型过于简单,参数考虑不全面
- 关于过拟合产生的原因下列说法正确的是() A: 欠拟合是因为模型结构未能反映数据真实结构 B: 过拟合是因为模型结构未能反映数据真实结构 C: 过拟合是因为模型结构太过细致,对数据细小变化太敏感 D: 欠拟合是因为模型结构太过细致,对数据细小变化太敏感