数据挖掘中常见的“异常算法”有哪些,都是怎样计算的? 数据挖掘约等于机器学习,机器学习算法可分为两种:一是有监督算法,即参数需要利用已有知识加以训练的算法,二是半监督算法,即虽不需要训练参数但需要定义任务的算法。不存在真正意义的无监督算法,理由见最后一段。有监督算法包括:分类(knn/logit/probit/cart/treenet/svm/ann…)、预测(regression)、推理(rbr/cbr);半监督算法包括:聚类(kmeans/birch/…)、pca(sdv)、频繁项集分析与关联分析(apriori)。有监督算法替代人工推理,运用已知经验解决已知问题,半监督算法主动探索对象,发现隐秘关联,实现未知知识发现。几乎不可能实现真正意义上的无监督算法,因为无监督意味着机器的自由意志,机器可以自主发起任务而无须人类布置。如果真正的无监督算法能实现,强人工智能就能实现。对数据挖掘有兴趣: 为了实现“ 海量数据处理和挖掘的基本算法”这一点我该怎么学习,或者培训点什么课程 1楼疯了,那里都能看到。是这样的,数据挖掘是建立在庞大的数据集上的。基本算法没法说,太乱。建议你先找点书去看看。比如《数据挖掘导论》,《数据挖掘概念与技术》看看再说。在数据挖掘过程中,好像有些算法要求变量必须是正太分布的,我想知道什么时候需要对数据进行标准化处理? 标准化/归一化都是对变量进行scale的数据预处理基本方法,是否采用或采用哪种,完全取决于你使用的数据分析处理算法的需求。此类预处理主要有两个目的,一是使变量间尺度接近,避免出现计算误差或影响如距离之类度量的均衡性。二是使各变量值或样本矢量的度量值在算法要求的区间内。至于正态分布性,一般是算法的适用假设,应该在算法应用前或后做此检验以保证可靠性,而不是要求用什么变换方法把数据处理成正态分布。如误差的正态分布假设是回归无偏的基本条件,或某些基于类簇是正态分布的聚类算法只有在问题确实符合这种模式下才能得到正确结果。当然,如果仅仅要将特定分布数据转换成另一种分布还是有办法的。但用途应该比较特殊。用于数据挖掘的分类算法有哪些,各有何优劣? 尝试将quora上的这翻译了下。第一次翻译,不好之处请见谅。What are the advantages of different…急用!!!数据挖掘的六种常用算法和技术分别是什么? 分类和回归关联规则聚类分析孤立点分析演变分析数据挖掘中常见的“异常算法”有哪些,都是怎样计算的? 1.Ksigma:数值异常检测中常用的方法,简单易用2.Box Plot:数据如果不满足正态假设的话,可以用Box plot3.Isolation forest:典型的无监督算法,不需要任何标注,只需要数据即可。4.SOS异常检测:类似KNN的思路,但效率成问题5.LOF:同样是可能有效率问题6.基于聚类的方法:聚类结果中的大类认为正常,小类认为异常怎么从一个有算法基础但是没有项目经验的学生,成长为数据挖掘工程师? 考研数一146分怒答。同养是其他专业想要尝试转数据挖掘,我的学习路线如下,供题主参考:1,coursera上NG…
随机阅读
- 中诚信托 谁接盘 请问在中诚信托公司工作是一种怎么样的体验?
- 三洋水位传感器在哪里 三洋洗衣机水位传感器在哪里
- 初级长拳第三路授课教案怎么写 三路长拳第一节教案
- 地球给我们贡献了什么资源 美国占了地球上越来越多的资源财富,美国对人类社会有什么贡献?
- 温暖快乐美好的爱情歌词 求!蔡诗云的《有你很快乐》的歌词
- 三亚市崖州水中桥 去三亚自游行有哪些攻略推荐?
- cf5月幸运骰子视频 《英雄联盟》、《绝地求生》、《穿越火线》和《地下城与勇士》四个网游,你觉得谁能笑到最后?
- 母羊有肾吗?公羊有肾,母羊也有肾吗? 母山羊的肾能吃吗
- 关于元数据管理功能的概述 数据目录管理服务
- 狗狗不吃饭往犄角旮旯钻 家里的小狗钻进犄角旮旯里就不出来了怎么弄也不出来
- 水井抽水后怎样水不能回流 深井泵抽水水抽上来一下大一下小一会儿有水一会儿又停了怎么回事是水泵出了问题吗
- 没有朋友可以自己一个人去医院做无痛人流吗 汉沽区津滨医院可以做无痛人流吗
- 深圳汉京山23楼 汉京山怎么样?好不好?值不值得买?
- 怎么评价李晓明,和李晓明工笔画? 工笔水仙花图李晓明
- 梦见救了好多人是什么意思啊 梦到仙逝的人救了自己是什么意思?
- 蓟县毛家峪水世界 天津周边哪个城市适合自驾游?
- 以华制华中国人不打中国人 我不是中国人。所以没有
- 惠来四乡村有什么特点 葵潭镇吉镇村黄英民
- 城南旧事中宋妈为什么被丈夫接? 城南旧事中的小栓子几岁
- 上海哪个证券投资公司比较可靠?最近想开户来着 上海投资公司与上海证券公司那个好