通常来说,我们构建模型,使其在训练集上能够做出准确预测,如果训练集和测试集足够相似,我们预计模型在测试集上也能做出准确预测。
举一反三
- 关于训练集和测试集的划分,下面比较好的做法是: A: 将手头上所有的数据拿来训练模型,预测结果正确率最高的模型就是我们所要选的模型 B: 将所有数据中的前百分之80拿来训练模型,剩下的百分之20作为测试集,测试集预测结果正确率最高的模型就是我们所要选的模型 C: 将所有数据先随机打乱顺序,百分之80用来训练模型,剩下的百分之20作为测试集,测试集预测结果正确率最高的模型就是我们所要选的模型 D: 将所有数据先随机打乱顺序,平均分成5份,轮流拿出其中1份作为测试集,其余的4份做为训练集,各次测试集预测的正确率求均值,正确率均值最高的模型就是我们所要选的模型
- 如果一个训练模型在测试集上精度达到100%,那么在另一个测试集精度上也能达到100%
- 过拟合是指( )。 A: 在训练集表现非常好,但在测试集上表现很差 B: 在训练集表现非常好,但在测试集上表现也非常好 C: 在训练集表现非常差,但在测试集上表现也差 D: 在训练集表现非常差,但在测试集上表现非常好
- 有监督学习一般分成两个阶段,在训练集上进行模型的学习,在测试集上测试模型的性能
- 中国大学MOOC: 如果一个训练模型在测试集上精度达到100%,那么在另一个测试集上精度不一定能达到100%。