对于分类任务而言,IRIS数据集的样本特征维度是______ ; 利用其中每一类80%的样本的全部已知信息作为训练数据构建一个分类器,所采用的机器学习方法应为______ 学习;基于数据学习得到的模型再处理新数据方面的能力被称为______ 能力;一个模型无论如何学习也无法在训练数据上取得令人满意的效果,说明该模型的______ 不足。
举一反三
- ( )利用已知类别的样本,训练学习得到一个最优模型,使其达到所要求性能,再利用这个训练所得模型对未知数据进行分类。 A: 强化学习 B: 半监督学习 C: 无监督学习 D: 监督学习
- 在机器学习过程中,训练过程中使用的数据样本集合称为 A: 训练集 B: 结果集 C: 模型集 D: 学习集
- 想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型( )? A: 对训练集随机采样,在随机采样的数据上建立模型 B: 尝试使用在线机器学习算法 C: 使用PCA算法减少特征维度
- 神经网络模型是数据挖据中常见的一种模仿人类思维方式的机器学习算法模型,在用于预测分析时,先需要通过一个较小规模的“样本”数据“学习”出输入与输出之间可能存在的某种关系模式,从而建立预测模型。类似这种机器学习算法,又被称为_________,其中用到的“样本”数据一般被称为_______。 A: 无监督学习训练数据 B: 监督学习测试数据 C: 监督学习训练数据 D: 无监督学习测试数据
- 模型算法中,对样本数据机器学习时,通常把数据集分为训练集和测试集()