ZKX's LAB

分类和聚类的区别及各自的常见算法 划分聚类方法

2020-10-15知识21

在大数据分析中哪些聚类算法是最常使用的? 聚类算法那么多,并不清楚具体哪些才是真正用的到的,不能够选择性的学习.

分类和聚类的区别及各自的常见算法 划分聚类方法

用于数据挖掘的聚类算法有哪些,各有何优势?

分类和聚类的区别及各自的常见算法 划分聚类方法

谱聚类算法的划分准则 谱聚类算法将聚类问题转化为图的划分问题之后,基于图论的划分准则的优劣直接影响到聚类结果的好坏。常见的划分准则有Mini cut,Average cut,Normalized cut,Min-max cut,Ratio cut,MNcut等。Mini cut准则容易出现分割出只包含几个顶点的较小子图的歪斜分割现象,Ratio cut和Normalized cut等在一定程度上可以避免这种现象,但是当类间重叠严重时歪斜分割现象仍旧会发生。Chris Ding等人提出的基于Min-max cut的图划分方法充分体现了“子图内部相似度最大,子图之间的相似度最小”原则,能够产生比较平衡划分。上述五种划分都是不断地将图划分为2个子图的反复迭代运算过程,当划分函数的最小值满足一定的条件时迭代过程便会终止,相应的函数可以称为2-way划分函数。Meil?和Xu[64]认为可以同时把图划分为k个子图并于2004年提出了一种k-way规范割目标函数,而且对于参数k的选取问题也作了分析说明。我们可以发现当k=2时,MNcut与Ncut两者是等价的。

分类和聚类的区别及各自的常见算法 划分聚类方法

什么情况下使用基于划分聚类的算法 你指的就是聚类算法吧,能说下你要解决的具体问题或领域么,不然没法一概而论。一般而言,针对一组没法完全看出优劣的数据或者图像或者情况,用聚类算法去分类至少有个算法理论依据。就像判断一群人里每个人的好坏,你也没法说清,但是用聚类先去划分好,至少有个结果,而且这个结果还有一点理论依据

#分类数据#模糊聚类分析#层次聚类方法#无监督学习#模糊

随机阅读

qrcode
访问手机版