有哪些常用的聚类算法? https://www. kdnuggets.com/2018/06/5 -clustering-algorithms-data-scientists-need-know.html 翻译:非线性 审校:wanting 中文翻译首发于“集智学园”公众号
dps01聚类时0-1化阈值一般为多大 你的应用背景我不了解。但是感觉你好像要把样本分成三类,如果是这样的话,最好不要用层次聚类算法。层次聚类算法是不能自己指定聚类个数的,你需要用划分的聚类算法。聚类算法粗略分为两类:基于“层次的”与基于“划分”的。你说的模糊聚类算法也分很多种,最著名的也是最常用的就是模糊c均值聚类算法,它是基于“划分”的,个人感觉它应该适用于你的问题。你不需要把“层次”聚类与“划分”的或者“模糊”聚类进行结合。模糊c均值聚类本身就可以人为指定聚类个数,如果结合聚类有效性指标,也可以自动确定聚类个数。聚类有效性指标以及模糊c均值你可以查文献,上中国知网搜索,很多的,要想看具体的介绍可以搜索相关博士或者硕士论文,在里面都会介绍具体细节。模糊c均值的改进算法主要是可能性聚类算法,希望对你有帮助。
基于距离的聚类算法 阈值怎么确定 应该是根据经验值或者是回归自然决定。