按7:3的比例将iris(鸢尾花)数据集划分为训练集与测试集,使用SVC算法对簇标签进行预测,并查看分类结果的混淆矩阵,编程实现。
举一反三
- 编写Python程序,完成以下操作:(1)加载iris数据集,并划分为训练集和测试集;(2)对iris数据集使用PCA降维,把现有的4维数据减少到3维;(3)使用SVM对iris数据集进行分类,并打印出分类报告,评价分类模型性能。
- 使用默认参数的DBSCAN对iris(鸢尾花)数据集进行聚类,并与K-Means聚类结果进行对比。
- 关于数据集划分,下列说法正确的是( ) A: 训练集的数据总是越多越好 B: 训练集的数据量越大,模型的泛化能力越好 C: 训练集与测试集的理想划分比例是5:5 D: 庞大数据集的训练集与测试集的划分比例可以为9:1
- 关于数据集划分,下列说法正确的是()。 A: 训练集的数据总是越多越好 B: 训练接与测试集的理想划分比例是5:5 C: 庞大数据集的训练集与测试集的划分比例可以为9:1 D: 训练集的数据量越大,模型的泛化能力越好
- 哪种语料是情感分类语料? A: IMDB 电影评论 B: Amazon review数据集 C: 20newsgroup数据集 D: iris鸢尾花数据集