使用默认参数的DBSCAN对iris（鸢尾花）数据集进行聚类，并与K-Means聚类结果进行对比。

2022-05-30

使用默认参数的DBSCAN对iris（鸢尾花）数据集进行聚类，并与K-Means聚类结果进行对比。

答案：

from sklearn import datasetsfrom sklearn.cluster import KMeansfrom sklearn.cluster import DBSCANimport matplotlib.pyplot as plt# 导入数据iris = datasets.load_iris()x = iris.datay = iris.targetplt.scatter(x[:, 0], x[:, 1], c=y)plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.title('原始数据', size=17)plt.show()# 生成DBSCAN模型，使用默认参数ds_pre = DBSCAN().fit_predict(x)plt.scatter(x[:, 0], x[:, 1], c=ds_pre)plt.title('DBSCAN', size=17)plt.show()# K-means聚类km_pre = KMeans(n_clusters=3, random_state=9).fit_predict(x)plt.scatter(x[:, 0], x[:, 1], c=km_pre)plt.title('K-means', size=17)plt.show()

举一反三

内容

0
使用DBSCAN算法对鸢尾花数据集（Iris.arff）进行聚类，将epsilon参数设置为0.2， minPoints参数设置为5，忽略class属性，那么将形成（）个簇。
1
使用KMEANS、DBSCAN等多种聚类算法对同一数据集进行聚类时，可能会得到不同的分组数（类数），分组数较多的聚类算法一般是比较好的。
2
针对如下二维数据集，取半径为3，阈值为3，使用DBSCAN算法对其聚类，最后聚类结果为 ______ 和 ______ ，
3
K-means算法适合对不规则形状的数据进行聚类。
4
下面属于聚类算法的有（） A: K-Means B: 均值偏移聚类算法 C: DBSCAN聚类算法 D: 使用高斯混合模型（GMM）的期望最大化（EM）聚类