• 2022-05-30
    使用默认参数的DBSCAN对iris(鸢尾花)数据集进行聚类,并与K-Means聚类结果进行对比。
  • from sklearn import datasetsfrom sklearn.cluster import KMeansfrom sklearn.cluster import DBSCANimport matplotlib.pyplot as plt# 导入数据iris = datasets.load_iris()x = iris.datay = iris.targetplt.scatter(x[:, 0], x[:, 1], c=y)plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.title('原始数据', size=17)plt.show()# 生成DBSCAN模型,使用默认参数ds_pre = DBSCAN().fit_predict(x)plt.scatter(x[:, 0], x[:, 1], c=ds_pre)plt.title('DBSCAN', size=17)plt.show()# K-means聚类km_pre = KMeans(n_clusters=3, random_state=9).fit_predict(x)plt.scatter(x[:, 0], x[:, 1], c=km_pre)plt.title('K-means', size=17)plt.show()

    内容

    • 0

      使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成()个簇。

    • 1

      使用KMEANS、DBSCAN等多种聚类算法对同一数据集进行聚类时,可能会得到不同的分组数(类数),分组数较多的聚类算法一般是比较好的。

    • 2

      针对如下二维数据集,取半径为3,阈值为3,使用DBSCAN算法对其聚类,最后聚类结果为 ______ 和 ______ ,

    • 3

      K-means算法适合对不规则形状的数据进行聚类。

    • 4

      下面属于聚类算法的有( ) A: K-Means B: 均值偏移聚类算法 C: DBSCAN聚类算法 D: 使用高斯混合模型(GMM)的期望最大化(EM)聚类