练习:利用Sklearn库的K-means算法实现对鸢尾花数据的聚类(K值取2)
from sklearn.cluster import KMeansfrom sklearn.datasets import load_irisdatas = load_iris()X = datas.datay = datas.targetkmeans = KMeans(n_clusters=2, random_state=0)kmeans.fit(X)kmeans.labels_kmeans.cluster_centers_kmeans.predict(X)import matplotlib.pyplot as pltcolors=['r','g','b','c']markers=['o','s','D','+']for i, j in enumerate(kmeans.labels_): plt.plot(X[i][0],X[i][1], color=colors[j],marker=markers[j])plt.show()[/i][/i]
举一反三
内容
- 0
机器学习扩展库sklearn的neighbors模块提供了k近邻算法的实现。
- 1
下列关于K-Means算法的说法错误的是( ) A: 构建K-Means聚类模型需要对数据进行标准化 B: K-Means算法涉及空间距离计算 C: K-Means算法训练结果具有一定的随机性,所以需要多次训练 D: K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法
- 2
无监督学习方法有 k ﹣均值( k - means )聚类算法、高斯混合模型等。()
- 3
关于K-means聚类说法正确的是( )。 A: K-means的聚类中心是聚类中心的均值 B: K-means实现采用的是贪心策略 C: K-means的聚类中心一定是样本空间的数据 D: K-means需要事先指定K的数目
- 4
使用默认参数的DBSCAN对iris(鸢尾花)数据集进行聚类,并与K-Means聚类结果进行对比。