ZKX's LAB

数据挖掘工程师入门 数据挖掘该如何入门?

2020-07-24知识15

想去做数据挖掘 该怎么入门呢 难得在这个版看到这类帖子。我不是软件工程师,视野也有限。算法、统计学、分布式系统、数据可视化是必须的。除了算法、统计学、机器学习等基础知识,Java、C++之类的编程语言肯定是要搞的,R、Hadoop甚至Teredata之类的都是加分项。具体的工作内容要看行业了,现在数据挖掘用得比较多的就是电子商务、社交网络、咨询公司等等。淘宝正在大力网罗这方面的人,有基础的话可以试试。数据分析师和数据挖掘工程师的区别 1.数据分析和数据挖掘联系和区别 联系:都是搞数据的 区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多怎么从一个有算法基础但是没有项目经验的学生,成长为数据挖掘工程师? 考研数一146分怒答。同养是其他专业想要尝试转数据挖掘,我的学习路线如下,供题主参考:1,coursera上NG…数据挖掘该如何入门? 恰好本人从事数据分析工作10几年,略懂一些,浅谈粗浅看法:1、首先您得有基本的统计学,概率论等功底,不用太高深,掌握常用的基础理论即可,数据挖掘掌握的理论知识要多一些,高数,线性代数,等2、建议从简单的数据分析着手开始,垫定基础,熟练使用EXCEL,再进阶一点学学SPSS,多多练习3、数据挖掘与分析不同,数据分析偏重统计,出图表,可视化,小数据量,而数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,python是很有必要的工具4、推荐两本书入门:如何成为一名数据分析师,其实数据分析很简单,如何成为一名数据挖掘工程师数据挖掘工程师一般都做什么? 数据挖掘工程师是做什么的?数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步数据分析师与数据挖掘工程师,分别有什么从业要求? 谢邀,之前我回答过另一个问题,现在我把答案复制过来,仅供参考。我上一份工作是数据分析师,现在的工作是数据挖掘工程师,因此我可以以我自己的实际经验来回答这个问题。数据分析师和数据挖掘工程师,同属于数据领域的洞察者,但是两者的工作内容却有着不小的区别。对于一个数据分析师来说,最重要的并不是编程技能,而是逻辑分析能力、业务理解能力、报告展示能力等。数据分析师:数据分析师使用的主要工具可以是编程,但并非必要;因为现在已经存在大量的强大、易用的数据分析工具,比如Excel、Tableau、SPSS、SAS等,即使你没有编程能力,仍然能胜任绝大多数的数据分析工作;但是相对于数据挖掘工程师,你还额外需要一些能力,比如数据可视化的能力、写数据报告的能力、在领导甚至许多人面前做报告、讲演的能力等;同时,由于现在互联网公司都在讲大数据,数据的存储基本上在各种大数据平台和数据库中,因此你有必要掌握Hive、HDFS、MySQL等的使用,SQL的熟练掌握是不可避免的。数据分析师一般有两种,一种是面向业务的,主要对各业务线、产品经理、运营、各部门领导的需求提供支持,帮助他们分析业务、了解业务,发掘出业务中的问题并提供解决方案;另一种是偏宏观的。如何入门大数据(数据挖掘方面)? 具体的转岗方法论,已有的回答已经非常完整了,那么如果从具体的雇主招聘需求上看,如何向大数据方向靠拢…零基础自学如何成为合格的数据挖掘工程师? 可以淘宝影印版 Probability and Statistics(Open+Free)stanford 怎么着也不是很差https://www. coursera.org/learn/prob ability-intro Coursera。com/e du/python/introduction。想成为数据挖掘工程师,应该如何着手学习? 入门推荐你看《机器学习实战》,不需要你跑去学习算法和数据结构,不需要解析几何的知识,但是数理统计的基础你必须要有,期望、方差、常用的几种概率分布,尤其注意一下条件概率,因为朴素贝叶斯模型你一定要懂,线性代数至少你要明白矩阵乘法、行列式计算,再就是微积分知识,不然你看不懂所有基于梯度下降法的文献,行业内用的比较多的是c++,java和python,推荐你用python,很多模型不需要你造轮子,python有相关的第三方模块,很方便。数据挖掘涉及的内容比较泛,机器学习、数据挖掘、人工智能,但实际上这些知识大多是相通的,机器学习实战这本书是我看的启蒙书里很好的一本了,该有的都有,难度较小,有理论有实践,可以较快的对各种知识有个大概的了解,但是想要长期在这个行业发展,还需要学习更多的知识,比如说提到回归模型,你不仅仅要知道最小二乘法,你还要想到怎么进行数据清洗、哪些数据需要清洗,怎么规范数据,数据是否过多,要不要进行归约和降维,采用哪种回归模型,精确度大致要达到什么水平,要不要考虑过拟合和欠拟合,要不要进行交叉验证,几折交叉验证效果好,如果回归模型不适用,有哪些备选方案。比如说决策树模型,书上简单的讲了个if-then就完了。

#数据挖掘算法#商务智能#大数据#机器学习#数据分析

随机阅读

qrcode
访问手机版