练习：利用Sklearn库的K-means算法实现对鸢尾花数据的聚类（K值取2）

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-09

练习：利用Sklearn库的K-means算法实现对鸢尾花数据的聚类（K值取2）

答案：

from sklearn.cluster import KMeansfrom sklearn.datasets import load_irisdatas = load_iris()X = datas.datay = datas.targetkmeans = KMeans(n_clusters=2, random_state=0)kmeans.fit(X)kmeans.labels_kmeans.cluster_centers_kmeans.predict(X)import matplotlib.pyplot as pltcolors=['r','g','b','c']markers=['o','s','D','+']for i, j in enumerate(kmeans.labels_): plt.plot(X[i][0],X[i][1], color=colors[j],marker=markers[j])plt.show()[/i][/i]

举一反三

内容

0
机器学习扩展库sklearn的neighbors模块提供了k近邻算法的实现。
1
下列关于K-Means算法的说法错误的是( ) A: 构建K-Means聚类模型需要对数据进行标准化 B: K-Means算法涉及空间距离计算 C: K-Means算法训练结果具有一定的随机性,所以需要多次训练 D: K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法
2
无监督学习方法有 k ﹣均值（ k - means ）聚类算法、高斯混合模型等。（）
3
关于K-means聚类说法正确的是（）。 A: K-means的聚类中心是聚类中心的均值 B: K-means实现采用的是贪心策略 C: K-means的聚类中心一定是样本空间的数据 D: K-means需要事先指定K的数目
4
使用默认参数的DBSCAN对iris（鸢尾花）数据集进行聚类，并与K-Means聚类结果进行对比。