• 2022-06-09
    练习:利用Sklearn库的K-means算法实现对鸢尾花数据的聚类(K值取2)
  • from sklearn.cluster import KMeansfrom sklearn.datasets import load_irisdatas = load_iris()X = datas.datay = datas.targetkmeans = KMeans(n_clusters=2, random_state=0)kmeans.fit(X)kmeans.labels_kmeans.cluster_centers_kmeans.predict(X)import matplotlib.pyplot as pltcolors=['r','g','b','c']markers=['o','s','D','+']for i, j in enumerate(kmeans.labels_): plt.plot(X[i][0],X[i][1], color=colors[j],marker=markers[j])plt.show()[/i][/i]

    内容

    • 0

      机器学习扩展库sklearn的neighbors模块提供了k近邻算法的实现。

    • 1

      下列关于K-Means算法的说法错误的是( ) A: 构建K-Means聚类模型需要对数据进行标准化 B: K-Means算法涉及空间距离计算 C: K-Means算法训练结果具有一定的随机性,所以需要多次训练 D: K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法

    • 2

      无监督学习方法有 k ﹣均值( k - means )聚类算法、高斯混合模型等。()

    • 3

      关于K-means聚类说法正确的是( )。 A: K-means的聚类中心是聚类中心的均值 B: K-means实现采用的是贪心策略 C: K-means的聚类中心一定是样本空间的数据 D: K-means需要事先指定K的数目

    • 4

      使用默认参数的DBSCAN对iris(鸢尾花)数据集进行聚类,并与K-Means聚类结果进行对比。