ZKX's LAB

聚类算法 分类 聚类算法的聚类要求

2020-10-08知识18

有哪些常用的聚类算法? https://www. kdnuggets.com/2018/06/5 -clustering-algorithms-data-scientists-need-know.html 翻译:非线性 审校:wanting 中文翻译首发于“集智学园”公众号

聚类与分类有什么区别? 首先对经验数据进行分析,得到特征属性,以此特性进行挖掘,希望得到划分结果,这属于聚类还是分类?例如…

分类和聚类的区别及各自的常见算法 Classification(分类),对于一个classifier,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,。

如何确定聚类算法中的类别个数? 可以参考这篇博客http://www. cnblogs.com/huadongw/p/ 4101422.html 发布于 2017-04-16 ? 3 ? ? 1 条评论 ? ? ? 感谢 ? 杨超 读书湖畔的奶爸 。

聚类算法的聚类要求 许多聚类算法在小于 200 个数据对象的小数据集合上工作得很好;但是,一个大规模数据库可能包含几百万个对象,在这样的大数据集合样本上进行聚类可能会导致有偏的结果。我们需要具有高度可伸缩性的聚类算法。(high dimensionality)一个数据库或者数据仓库可能包含若干维或者属性。许多聚类算法擅长处理低维的数据,可能只涉及两到三维。人类的眼睛在最多三维的情况下能够很好地判断聚类的质量。在高维空间中聚类数据对象是非常有挑战性的,特别是考虑到这样的数据可能分布非常稀疏,而且高度偏斜。用户希望聚类结果是可解释的,可理解的,和可用的。也就是说,聚类可能需要和特定的语义解释和应用相联系。应用目标如何影响聚类方法的选择也是一个重要的研究课题。记住这些约束,我们对聚类分析的学习将按如下的步骤进行。首先,学习不同类型的数据,以及它们对聚类方法的影响。接着,给出了一个聚类方法的一般分类。然后我们详细地讨论了各种聚类方法,包括划分方法,层次方法,基于密度的方法,基于网格的方法,以及基于模型的方法。最后我们探讨在高维空间中的聚类和孤立点分析(outlier analysis)。

#模糊聚类分析#层次聚类方法#算法#无监督学习#聚类

随机阅读

qrcode
访问手机版