决策树属于有监督学习算法,需要根据已知样本数据及其目标来训练并得到一个可以工作的模型,然后再使用该模型对未知样本进行分类。
对
举一反三
- ( )利用已知类别的样本,训练学习得到一个最优模型,使其达到所要求性能,再利用这个训练所得模型对未知数据进行分类。 A: 强化学习 B: 半监督学习 C: 无监督学习 D: 监督学习
- 与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种有监督的学习算法。( )
- 关于监督学习与非监督学习的说法,正确的是: A: 监督学习在模型训练过程中需要使用样本的标签 B: 非监督学习在模型训练过程中无需使用样本的标签 C: 监督学习往往需要人工事先标注大量的数据 D: 聚类是一种典型的非监督学习算法
- 对于分类任务而言,IRIS数据集的样本特征维度是______ ; 利用其中每一类80%的样本的全部已知信息作为训练数据构建一个分类器,所采用的机器学习方法应为______ 学习;基于数据学习得到的模型再处理新数据方面的能力被称为______ 能力;一个模型无论如何学习也无法在训练数据上取得令人满意的效果,说明该模型的______ 不足。
- 下列关于有监督学习的说法不正确的是 A: 支持向量机模型中距离平面最近的几个样本对平面的选择影响最大 B: 决策树算法中最能将样本数据显著分开的属性应该在决策早期就使用 C: 模型测试阶段的测试数据集不能与训练数据集有交集 D: K近邻算法中K值的选择对分类的结果影响不大
内容
- 0
下列关于有监督学习的说法不正确的是( )。 A: K近邻算法中K值的选择对分类的结果影响不大 B: 决策树算法中最能将样本数据显著分开的属性应该在决策早期就使用 C: 支持向量机模型中距离平面最近的几个样本对平面的选择影响最大 D: 模型测试阶段的测试数据集不能与训练数据集有交集
- 1
数值预测与分类都属于有监督学习,解决问题的过程相同,都是先通过训练数据集进行学习,以得到一个模型然后利用模型进行预测。
- 2
k 近邻方法不需要事先学习分类模型,当需要预测的时候,根据预测样本的特性和已知训练数据集中的数据进行类别的判断。
- 3
模型的泛化能力是指学习算法(模型)对()样本的适应能力。 A: 训练集 B: 测试集 C: 验证集 D: 未知样本
- 4
神经网络模型是数据挖据中常见的一种模仿人类思维方式的机器学习算法模型,在用于预测分析时,先需要通过一个较小规模的“样本”数据“学习”出输入与输出之间可能存在的某种关系模式,从而建立预测模型。类似这种机器学习算法,又被称为_________,其中用到的“样本”数据一般被称为_______。 A: 无监督学习训练数据 B: 监督学习测试数据 C: 监督学习训练数据 D: 无监督学习测试数据