• 2022-05-31
    sklearn的model_selection 模块中train_test_split函数的作用是什么?( )
    A: 通过参数随机生成训练集和测试集
    B: 删除数据集中的冗余项
    C: 将数据集按照参数划分成训练集和测试集两部分(留出法)
  • C

    内容

    • 0

      测试集是训练机器学习算法的数据集训练集是用来评估经训练后的模型性能的数据集验证集是用来微调模型超参数的数据集。

    • 1

      机器学习(深度学习)系统中通常将数据集划分为训练集和测试集,其中被用来学习得到系统的参数取值的是 A: 训练集(training set) B: 测试集(testing set) C: 训练集(training set)和测试集(testing set) D: 其它选项都不对

    • 2

      机器学习系统中通常将数据集划分为训练集和测试集,其中被用来学习得到模型中参数值的是( )。 A: 训练集 B: 测试集 C: 训练集和测试集 D: 以上答案都不对

    • 3

      在进行数据分析时,经常要分割训练集、测试集,并且还要考虑数据预处理、特征抽取、特征工程等,那么要仔细分析这些步骤之间的相互联系。关于训练集、测试集、数据预处理、特征工程,请回答以下问题关于缺失值填充与训练集、测试集的关系,下面正确的操作是() A: 先用全数据的均值填充缺失值,然后随机分割训练集、测试集 B: 先随机分割训练集、测试集,然后用各自集合的均值填充缺失值 C: 先随机分割训练集、测试集,然后用训练集的均值填充缺失值 D: 先随机分割训练集、测试集,然后用测试集的均值填充缺失值

    • 4

      关于数据集划分,下列说法正确的是( ) A: 训练集的数据总是越多越好 B: 训练集的数据量越大,模型的泛化能力越好 C: 训练集与测试集的理想划分比例是5:5 D: 庞大数据集的训练集与测试集的划分比例可以为9:1