关于训练集、验证集、测试集,下述说法正确的是:________
A: 在数据量很小或者数据量很大的时候,都必须有20%的数据用于测试集
B: 在数据量很小或者数据量很大的时候,都必须有10%的数据用于测试集
C: 在数据量很小或者数据量很大的时候,都必须有5%的数据用于测试集
D: 以上都不对
A: 在数据量很小或者数据量很大的时候,都必须有20%的数据用于测试集
B: 在数据量很小或者数据量很大的时候,都必须有10%的数据用于测试集
C: 在数据量很小或者数据量很大的时候,都必须有5%的数据用于测试集
D: 以上都不对
D
举一反三
- 关于数据集划分,下列说法正确的是( ) A: 训练集的数据总是越多越好 B: 训练集的数据量越大,模型的泛化能力越好 C: 训练集与测试集的理想划分比例是5:5 D: 庞大数据集的训练集与测试集的划分比例可以为9:1
- 关于数据集划分,下列说法正确的是()。 A: 训练集的数据总是越多越好 B: 训练接与测试集的理想划分比例是5:5 C: 庞大数据集的训练集与测试集的划分比例可以为9:1 D: 训练集的数据量越大,模型的泛化能力越好
- 下面的说法中,错误 的是: A: 特征列是指用于预测目标数据的数据列 B: 测试集是用来评估模型效果的数据行 C: 训练集数量一般要大于测试集 D: 即使测试集数量大于训练集,测试集也不能当成训练集
- 在模型训练的时候为什么要将数据集拆分成训练集和测试集?( ) A: 测试集与训练集数据不能有重复.防止过拟合 B: 需要划分测试集数据用来调参 C: 数据集太多.训练模型用不了这么多数据
- 信息量、数据量和数据冗余量的关系是( )。 A: 数据量大于信息量 B: 信息量大于数据量 C: 数据冗余量大于数据量 D: 数据量等于信息量
内容
- 0
一般将原始业务数据分为多个部分,()用于模型的构建。 A: 训练集 B: 测试集 C: 验证集 D: 全部数据
- 1
分类问题中,训练集和测试集中的样本数据量必须相同。
- 2
一般将所有数据分为训练集、验证集和测试集。
- 3
机器学习中,用于学习的经验数据集合称为( ) A: 训练集 B: 测试集 C: 验证集 D: 标签集
- 4
测试集是训练机器学习算法的数据集训练集是用来评估经训练后的模型性能的数据集验证集是用来微调模型超参数的数据集。