ZKX's LAB

韩家炜数据挖掘之数据的删减

2020-07-17知识25

各位大侠,我先了解一下数据仓库和数据挖掘的一些东西 入门级的 求推荐 看看 这本书:数据挖掘概念与技术。很基础,也很全面。数据挖掘的权威图书。有哪位工作了的数据挖掘工程师可以回答? 数据挖掘从业人员工作分析:数据挖掘从业人员的愿景:数据挖掘就业的途径从我看来有以下几种,(注意:本文所说的数据挖掘不包括数据仓库或数据库管理员的角色)。A:做科研(在高校、科研单位以及大型企业,主要研究算法、应用等)B:算法工程师(在企业做数据挖掘及其相关程序算法的实现等)C:数据分析师(在存在海量数据的企事业单位做咨询、分析等)数据挖掘从业人员切入点:根据上面的从业方向来说说需要掌握的技能。A:做科研:这里的科研相对来说比较概括,属于技术型的相对高级级别,需要对开发、数据分析的必备基础知识。B:算法工程师:主要是实现数据挖掘现有的算法和研发新的算法以及根据实际需要结合核心算法做一些程序开发实现工作。要想扮演好这个角色,你不但需要熟悉至少一门编程语言如(C,C++,Java,Delphi等)和数据库原理和操作,对数据挖掘基础课程有所了解,读过《数据挖掘概念与技术》(韩家炜著)、《人工智能及其应用》。有一点了解以后,如果对程序比较熟悉的话并且时间允许,可以寻找一些开源的数据挖掘软件研究分析,也可以参考如《数据挖掘:实用机器学习技术及Java实现》等一些教程。C:数据分析师:需要有深厚的数理统计基础,可以不知道人工推荐几本有关数据挖掘的比较经典的书吧 数据挖掘:概念与技术—韩家炜;数据挖掘导论(完整版)这两本书比较厚,得耐着性子看才好程序员或者数据分析师,数据挖掘工程师必须要终身学习吗? 目前在一个双非末流一本读数据科学,我一向很咸鱼的,也挺愿意当一条混得还行的咸鱼,真的不喜欢努力。什么是数据挖掘?数据挖掘怎么做啊? 数据挖掘简单地说就是,在大型数据库中,自动发现有用信息的过程,加以分析。其中数据库中的知识发现是重要的环节,也就是人们说的KDD,knowledge discovery in database。网舟科技在数据分析与可视化方面有自己独特的见解与心得,专注美国Adobe数据产品的实际应用分析。2KDD是什么其实就是一个数据处理的过程,从输入数据开始,进行预处理工作,包括特征选择,维归约规范化和选择数据子集等等,随后进行分析和挖掘,再经过处理,例如模式过滤,可视化,模式表示等,最后形成可用信息的过程。3数据挖掘要解决什么问题具体的讲主要是以下几个,首先是数据的可伸缩性,提高或改变数据的可伸缩度。其次是解决数据高维性的问题。处理异种数据和复杂数据。解决数据所有权与分布问题。对非传统的分析进行合理处理。4数据挖掘的任务其实主要包括四个大块,可以独立运行,也可以联合操作,分别是聚类分析,预测建模,关联分析,异常检测。聚类分析实用的技术包括K均值,凝聚层次聚类,dbscan,簇评估等,主要目的是通过基于原型,密度,图等的聚类,发现其间的关系。预测建模则更多的是一种可视化角度分析方法,利用分类,回归等方法,来建立模型解决问题。关联分析数据挖掘有哪些好书啊,可以推荐一下吗? 数据挖掘概念与技术(原书第2版)作 者:(加)韩家炜,堪博 著,范明,孟小峰 译出 版 社:机械工业出版社数据挖掘导论—图灵计算机科学丛书作 者:(美)谭,(美)斯坦巴赫 著,范明 等译出 版 社:人民邮电出版社我没看过,我从当当网上找的,有书评,你也可以去看看,韩家炜的人物经历 韩教授1978毕业于 郑州大学 计算机科学 系,同年考入 中科院研究生院,1985年 美国威斯康辛大学 计算机系博士毕业。韩教授的研究方向是数据挖掘(Data Mining),他领导 大哥啊 求帮助怎么自学数据挖掘啊 嗯,学这些对数据挖掘都很有帮助,特别是数学建模。不知道有没有读过 韩家炜的《数据挖掘概念与技术》这本书,这是数据挖掘最基础的书了,写的也非常好。讲了概念、数据仓库、关联规则、分类、聚类、离群点检测等,而且很多算法还提供了伪码,这是一般书做不到的。内容比较多,适合长期阅读、动手。然后就是读读机器学习的书,数据挖掘最大两块聚类、分类就是机器学习。推荐这本至于工具吧,就很多选择了,我用的比较多的是R,还有什么weka,分布式处理的Hadoop等。用于数据挖掘的聚类算法有哪些,各有何优势? 如果真要做全面介绍的话,有可能是一部专著的篇幅。即使是做综述性的介绍,一篇三五十页的论文也可以写成…国内有哪些数据分析和数据挖掘的牛人? 数据分析牛人(排名不分先后)转载 数据分析达人博客大全一、沈浩老师中国传媒大学教授,这位老师给我…

#数据挖掘#聚类#大数据#数据挖掘算法#数据分析

随机阅读

qrcode
访问手机版