聚类遗传算法关联规则，聚类分析，决策树算法，遗传算法各自的适应场合？

2020-10-14知识28

用于数据挖掘的聚类算法有哪些，各有何优势 1、层次聚类2113算法1.1聚合聚类1.1.1相似度依据距离不5261同：Single-Link：最近距离、4102Complete-Link：最远距离、Average-Link：平均距离1.1.2最具代表性算法16531）CURE算法特点：固定数目有代表性的点共同代表类优点：识别形状复杂，大小不一的聚类，过滤孤立点2）ROCK算法特点：对CURE算法的改进优点：同上，并适用于类别属性的数据3）CHAMELEON算法特点：利用了动态建模技术1.2分解聚类1.3优缺点优点：适用于任意形状和任意属性的数据集；灵活控制不同层次的聚类粒度，强聚类能力缺点：大大延长了算法的执行时间，不能回溯处理2、分割聚类算法2.1基于密度的聚类2.1.1特点将密度足够大的相邻区域连接，能有效处理异常数据，主要用于对空间数据的聚类2.1.2典型算法1）DBSCAN：不断生长足够高密度的区域2）DENCLUE：根据数据点在属性空间中的密度进行聚类，密度和网格与处理的结合3）OPTICS、DBCLASD、CURD：均针对数据在空间中呈现的不同密度分不对DBSCAN作了改进2.2基于网格的聚类2.2.1特点利用属性空间的多维网格数据结构，将空间划分为有限数目的单元以构成网格结构；1）优点：处理时间与数据对象的数目无关，与数据的输入顺序。

机器学习中，有没有给定的阈值返回聚类结果的算法机器学习通过从数据里提取规则或模式来把数据转换成信息。主要的方法有归纳学习法和分析学习法。数据首先被预处理，形成特征，然后根据特征创建某种模型。机器学习算法分析收集到的数据，分配权重、阈值和其他参数达到学习目的。如果只想把数据分成不同的类，那么“聚类”算法就够了；如果需要预测，则需要一个“分类”算法。OpenCV库里面包含的是基于概率统计的机器学习方法，贝叶斯网络、马尔科夫随机场、图模型等较新的算法还在成长过程中，所以OpenCV还没有收录。机器学习的算法有很多很多：1、Mahalanobis2、K-means 非监督的聚类方法3、朴素贝叶斯分类器特征是高斯分布&统计上相互独立条件比较苛刻4、决策数判别分类器，根据阈值分类数据，速度快。ID3，C4.55、Boosting 多个判别子分类器的组合6、随机森林由多个决策树组成7、人脸检测/Haar分类器使用Boosting算法8、期望最大化EM 用于聚类的非监督生成算法9、K-近邻最简单的分类器10、神经网络（多层感知器）训练分类器很慢，但是识别很快11、支持向量机 SVM 可以分类，也可以回归。通过分类超平面实现在高维空间里的最优分类12、遗传算法借鉴生物遗传机制，随机化埂攻第煌郢号电铜钉扩非线性计算。

聚类遗传算法关联规则，聚类分析，决策树算法，遗传算法各自的适应场合？