ZKX's LAB

聚类的计算方法 如何计算聚类簇的中心

2020-10-11知识12

无监督聚类问题中,如何决定簇的最优数量 <;pre t=\"code\" l=\"python\">;#-*-coding:utf-8-*-from sklearn.cluster import KMeansfrom sklearn.externals import joblibimport numpyfinal=open('c:/test/final.dat','r')data=[line.strip().split('\\t')for line in final]feature=[[float(x)for x in row[3:]]for row in data]调用kmeans类clf=KMeans(n_clusters=9)s=clf.fit(feature)print s9个中心print clf.cluster_centers_每个样本所属的簇print clf.labels_用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数print clf.inertia_进行预测print clf.predict(feature)保存模型joblib.dump(clf,'c:/km.pkl')载入保存的模型clf=joblib.load('c:/km.pkl')'''用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数for i in range(5,30,1):clf=KMeans(n_clusters=i)s=clf.fit(feature)print i,clf.inertia_'''

聚类的计算方法 如何计算聚类簇的中心

如何对用户进行聚类分析? 图片来源:http://www.exegetic.biz/blog/2015/10/monthofjulia-day-30-clustering/ 如上图,数据可以被分到红。https:// archive.ics.uci.edu/ml/ datasets/Online+Retail# 。

聚类的计算方法 如何计算聚类簇的中心

在大数据分析中哪些聚类算法是最常使用的? 聚类算法那么多,并不清楚具体哪些才是真正用的到的,不能够选择性的学习.

聚类的计算方法 如何计算聚类簇的中心

随机阅读

qrcode
访问手机版