• 2022-06-07
    在进行数据分析时,经常要分割训练集、测试集,并且还要考虑数据预处理、特征抽取、特征工程等,那么要仔细分析这些步骤之间的相互联系。关于训练集、测试集、数据预处理、特征工程,请回答以下问题关于缺失值填充与训练集、测试集的关系,下面正确的操作是()
    A: 先用全数据的均值填充缺失值,然后随机分割训练集、测试集
    B: 先随机分割训练集、测试集,然后用各自集合的均值填充缺失值
    C: 先随机分割训练集、测试集,然后用训练集的均值填充缺失值
    D: 先随机分割训练集、测试集,然后用测试集的均值填充缺失值