ZKX's LAB

聚类学习 为什么说聚类分析是一种无监督的学习方法

2020-10-09知识12

机器学习中的聚类分析,如何有效的确定簇数目大小? 机器学习中聚类分析的算法的确要求要先确定分几类,也就是簇数,作为一个数据挖掘工作者,也经常会用到聚类分析,那么该怎样确定这个数呢?说一下我做聚类分析确定簇数的方法1,根据业务来定义做聚类分析首先要知道做的是什么,也就是我们的分析对象,举个例子,如果我们要对全国城市来聚类,那可以有四五个簇类,比如一线,二线,三线,四线及以下或者五线等等,具体要确定。要根据业务需求和场景,也可以和业务人员或者运营人员来商讨,毕竟你做的分析是要用到实际业务中,必须要让他们认可你的分析结果。在商讨的过程中重点要讨论一下这个分析所对应的业务需求,他们在什么情况下用到这个分析,分析的目的是为了什么,想要得到一个什么样的结果,这几点一定要搞清楚如果说,业务人员也无法给出数目,或者只给出大概的数据范围怎么办?不慌,业务人员肯定无法告诉我们,我们还可以根据拿到的数据来判断。2,根据数据分布来判断业务或运营人员无法给出准确的数目,这个很正常,要是他们都能清楚的知道要分多少类,那还要我们数据挖掘人员干嘛呢。业务人员只能知道大概,而我们要提供精准的分析结果。根据数据来判断,最常用到散点图,根据样本的分布情况来判断簇类数目。

聚类学习 为什么说聚类分析是一种无监督的学习方法

机器学习聚类分析能做什么,聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的。

聚类学习 为什么说聚类分析是一种无监督的学习方法

无监督学习比如简单的聚类分析真的是“学习”吗?这里面真的有“学习”的概念吗? 其实我想说的是:“机器学习”里“学习”的概念究竟是什么呢?这种叫法真的能反应它的实际内容所涵概的范…

聚类学习 为什么说聚类分析是一种无监督的学习方法

聚类算法学习的经典书籍有哪些 推荐一些算法书籍,最后面有下载链接,如果想要其它书籍也可以点击那个链接通过自动回复获得《程序员的数学》书中讲 解了二进制计数法、逻辑、余数、排列组合、递归、指数爆炸、不可解问题等许多与编程密切相关的数学方法,分析了哥尼斯堡七桥问题、少年高斯求和方法、汉诺塔、斐波那契数列等经典问题和算法。引导读者深入理解编程中的数学方法和思路。本书还对程序员和计算机的分工进行了有益的探讨。读完此书,你会对以程序为媒介的人机合作有更深刻的理解。算法领域的经典参考书—《算法?第4版》《算法?第4版》全面介绍了关于算法和数据结构的必备知识,并特别针对排序、搜索、图处理和字符串处理进行了论述。第4 版具体给出了每位程序员应知应会的50 个算法,提供了实际代码,而且这些Java 代码实现采用了模块化的编程风格,读者可以方便地加以改造。本书配套网站提供了本书内容的摘要及更多的代码实现、测试数据、练习、教学课件等资源。《计算机程序设计艺术》系列《卷1:基本算法(第3版)》讲解基本算法,其中包含了其他各卷都需用到的基本内容。本卷从基本概念开始,然后讲述信息结构,并辅以大量的习题及答案。《卷2:半数值算法(第3版)》全面讲解。

聚类与分类有什么区别? 首先对经验数据进行分析,得到特征属性,以此特性进行挖掘,希望得到划分结果,这属于聚类还是分类?例如…

#聚类#层次聚类方法#机器学习#无监督学习

随机阅读

qrcode
访问手机版