K-means聚类算法中的K如何确定？聚类算法中的簇

2020-10-10知识7

机器学习中的聚类分析，如何有效的确定簇数目大小？机器学习中聚类分析的算法的确要求要先确定分几类，也就是簇数，作为一个数据挖掘工作者，也经常会用到聚类分析，那么该怎样确定这个数呢？说一下我做聚类分析确定簇数的方法1，根据业务来定义做聚类分析首先要知道做的是什么，也就是我们的分析对象，举个例子，如果我们要对全国城市来聚类，那可以有四五个簇类，比如一线，二线，三线，四线及以下或者五线等等，具体要确定。要根据业务需求和场景，也可以和业务人员或者运营人员来商讨，毕竟你做的分析是要用到实际业务中，必须要让他们认可你的分析结果。在商讨的过程中重点要讨论一下这个分析所对应的业务需求，他们在什么情况下用到这个分析，分析的目的是为了什么，想要得到一个什么样的结果，这几点一定要搞清楚如果说，业务人员也无法给出数目，或者只给出大概的数据范围怎么办？不慌，业务人员肯定无法告诉我们，我们还可以根据拿到的数据来判断。2，根据数据分布来判断业务或运营人员无法给出准确的数目，这个很正常，要是他们都能清楚的知道要分多少类，那还要我们数据挖掘人员干嘛呢。业务人员只能知道大概，而我们要提供精准的分析结果。根据数据来判断，最常用到散点图，根据样本的分布情况来判断簇类数目。

用于数据挖掘的聚类算法有哪些，各有何优势？这个问题我也想过，想的不太系统。比较分类算法的话，大概考虑这几个维度：时间空间复杂度，鲁棒性，参数…

K-means聚类算法中的K如何确定？聚类算法中的簇

K-means聚类算法中的K如何确定？数据集中所需的聚类簇数k未知，有什么方法能够将k计算出来？使用无监督学习在一个数据量5000级别的数据集…

K-means聚类算法中的K如何确定？聚类算法中的簇

所有的聚类算法都要指定\ 一，K-Means聚类算法原理k-means 算法接受参数 k然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小.聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的.

聚类算法的每个簇中对象个数相同吗是否可能取决于你的算法是如何实现的。建议你看看weka和matlab的km算法实现。聚类数小于k的原因是聚类过程中出现空簇，如果没有特殊的处理，这个问题是无法在后续的循环中自行解决的。weka的实现是允许输出聚类数小于k的，出现空簇就直接将空簇删除；而matlab的km有一个参数用于解决聚类数小于k的问题，例如直接选择最远离聚类中心的点作为一个新的簇。

在大数据分析中哪些聚类算法是最常使用的？聚类算法那么多，并不清楚具体哪些才是真正用的到的，不能够选择性的学习.

有哪些常用的聚类算法？ https：//www. kdnuggets.com/2018/06/5 -clustering-algorithms-data-scientists-need-know.html 翻译：非线性审校：wanting 中文翻译首发于“集智学园”公众号

用于数据挖掘的聚类算法有哪些，各有何优势？如果真要做全面介绍的话，有可能是一部专著的篇幅。即使是做综述性的介绍，一篇三五十页的论文也可以写成…

K-means聚类算法中的K如何确定？泻药，可以参考下R语言使用最优聚类簇数kmean、k-medoids聚类进行客户细分案例原文链接：http：//tecdat.…

用于数据挖掘的聚类算法有哪些，各有何优势？（https：//www. coursera.org/course/ml）A List of Data Science and Machine Learning http：//conductrics.com/data-science-resources/）转载自 THU数据派官方微信公众。

阅读全文

K-means聚类算法中的K如何确定？ 聚类算法中的簇

随机阅读

K-means聚类算法中的K如何确定？聚类算法中的簇