• 2021-04-14
    【简答题】电影网站用户性别预测(二):数据清洗和划分数据集 任务 1 、数据清洗,处理缺失值和异常代码值 任务2、划分数据集,将数据预处理的数据划分成训练数据集、验证数据集和测试数据集。 将任务运行成功页面及查看结果文件分别截图
  • 运行成功

    内容

    • 0

      有代码为:train_test_split(X, y, test_size=0.1)此时的test_size及其数值的含义是: A: 将训练集和测试集分别设为全部数据行的10%和90% B: 将训练集设为全部数据行的90% C: 将测试集设为全部数据列的10% D: 将训练集和测试集分别设为全部数据列的99.9%和0.1%

    • 1

      关于数据集划分,下列说法正确的是( ) A: 训练集的数据总是越多越好 B: 训练集的数据量越大,模型的泛化能力越好 C: 训练集与测试集的理想划分比例是5:5 D: 庞大数据集的训练集与测试集的划分比例可以为9:1

    • 2

      为进行分类模型的训练和性能评价,需要将输入的标注数据划分为 ( ) A: 测试集和采样集 B: 数据的类标和特征 C: 训练集和测试集 D: 预处理数据和非预处理数据

    • 3

      对于同一个数据集,不同的下载源提供的数据集格式、对训练集和测试集的划分方式可能不同。 A: 正确 B: 错误

    • 4

      关于数据集划分,下列说法正确的是()。 A: 训练集的数据总是越多越好 B: 训练接与测试集的理想划分比例是5:5 C: 庞大数据集的训练集与测试集的划分比例可以为9:1 D: 训练集的数据量越大,模型的泛化能力越好