• 2022-05-30
    下面的说法中,错误 的是:
    A: 特征列是指用于预测目标数据的数据列
    B: 测试集是用来评估模型效果的数据行
    C: 训练集数量一般要大于测试集
    D: 即使测试集数量大于训练集,测试集也不能当成训练集
  • D

    举一反三

    内容

    • 0

      有代码为:train_test_split(X, y, test_size=0.1)此时的test_size及其数值的含义是: A: 将训练集和测试集分别设为全部数据行的10%和90% B: 将训练集设为全部数据行的90% C: 将测试集设为全部数据列的10% D: 将训练集和测试集分别设为全部数据列的99.9%和0.1%

    • 1

      一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。

    • 2

      一般将所有数据分为训练集、验证集和测试集。

    • 3

      关于数据集划分,下列说法正确的是( ) A: 训练集的数据总是越多越好 B: 训练集的数据量越大,模型的泛化能力越好 C: 训练集与测试集的理想划分比例是5:5 D: 庞大数据集的训练集与测试集的划分比例可以为9:1

    • 4

      交叉验证法指将数据集分为训练集,评估集,测试集三个部分。