ZKX's LAB

聚类分簇 聚类算法的每个簇中对象个数相同吗

2020-09-27知识11

有哪些常用的聚类算法? https://www. kdnuggets.com/2018/06/5 -clustering-algorithms-data-scientists-need-know.html 翻译:非线性 审校:wanting 中文翻译首发于“集智学园”公众号

聚类分簇 聚类算法的每个簇中对象个数相同吗

机器学习中的聚类分析,如何有效的确定簇数目大小? 机器学习中聚类分析的算法的确要求要先确定分几类,也就是簇数,作为一个数据挖掘工作者,也经常会用到聚类分析,那么该怎样确定这个数呢?说一下我做聚类分析确定簇数的方法1,根据业务来定义做聚类分析首先要知道做的是什么,也就是我们的分析对象,举个例子,如果我们要对全国城市来聚类,那可以有四五个簇类,比如一线,二线,三线,四线及以下或者五线等等,具体要确定。要根据业务需求和场景,也可以和业务人员或者运营人员来商讨,毕竟你做的分析是要用到实际业务中,必须要让他们认可你的分析结果。在商讨的过程中重点要讨论一下这个分析所对应的业务需求,他们在什么情况下用到这个分析,分析的目的是为了什么,想要得到一个什么样的结果,这几点一定要搞清楚如果说,业务人员也无法给出数目,或者只给出大概的数据范围怎么办?不慌,业务人员肯定无法告诉我们,我们还可以根据拿到的数据来判断。2,根据数据分布来判断业务或运营人员无法给出准确的数目,这个很正常,要是他们都能清楚的知道要分多少类,那还要我们数据挖掘人员干嘛呢。业务人员只能知道大概,而我们要提供精准的分析结果。根据数据来判断,最常用到散点图,根据样本的分布情况来判断簇类数目。

聚类分簇 聚类算法的每个簇中对象个数相同吗

数据分类和聚类有什么区别 简单地说,分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。简单地说,聚类是指事先没有“标签”而通过某种成团分析。

聚类分簇 聚类算法的每个簇中对象个数相同吗

随机阅读

qrcode
访问手机版