ZKX's LAB

数据挖掘工程师书单

2020-07-17知识12

数据分析师,数据挖掘师,大数据工程师,三者的工作有何区别? 例如,在 http:// Indeed.com 上,如果输入“analyst sql”作为关键字,您将找到许多不同的职位,如 Performance Analyst,Healthcare Data Analyst 和 Demand Planning 程序员和数据挖掘工程师哪个岗位对写代码要求更高?程序员和数据挖掘工程师(数据分析师)哪个岗位对写代码能力要求更高,更严格呢?程序员和数据挖掘工程师的领域分别有数据挖掘工程师一般都做什么? 数据挖掘工程师是做什么的?数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步有哪位工作了的数据挖掘工程师可以回答? 数据挖掘从业人员工作分析:数据挖掘从业人员的愿景:数据挖掘就业的途径从我看来有以下几种,(注意:本文所说的数据挖掘不包括数据仓库或数据库管理员的角色)。A:做科研(在高校、科研单位以及大型企业,主要研究算法、应用等)B:算法工程师(在企业做数据挖掘及其相关程序算法的实现等)C:数据分析师(在存在海量数据的企事业单位做咨询、分析等)数据挖掘从业人员切入点:根据上面的从业方向来说说需要掌握的技能。A:做科研:这里的科研相对来说比较概括,属于技术型的相对高级级别,需要对开发、数据分析的必备基础知识。B:算法工程师:主要是实现数据挖掘现有的算法和研发新的算法以及根据实际需要结合核心算法做一些程序开发实现工作。要想扮演好这个角色,你不但需要熟悉至少一门编程语言如(C,C++,Java,Delphi等)和数据库原理和操作,对数据挖掘基础课程有所了解,读过《数据挖掘概念与技术》(韩家炜著)、《人工智能及其应用》。有一点了解以后,如果对程序比较熟悉的话并且时间允许,可以寻找一些开源的数据挖掘软件研究分析,也可以参考如《数据挖掘:实用机器学习技术及Java实现》等一些教程。C:数据分析师:需要有深厚的数理统计基础,可以不知道人工数据挖掘工程师在公司中一般都具体做什么?需要了解哪些知识? 以后想从事数据挖掘行业,但不清楚数据挖掘工程师的工作到底是做什么?如果仅仅只是用excel,sas,python…在数据分析、挖掘方面,有哪些好书值得推荐? 本题已加入圆桌「好书看得见」,更多好书,欢迎关注>>> ? 8 条评论 https://www. probabilitycourse.com/ Probability Theory:The Logic of Science 下载地址: 大数据工程师基础,希望转向数据挖掘,求推荐书籍? J.Leskovec,A.Rajaraman,J.Ullman,Mining of Massive Datasets(http://www. mmds.org/) J.Hopcraft,Foundations of Data Science 另外有http:// life.loftfun.com/news/ 零基础自学如何成为合格的数据挖掘工程师? 可以淘宝影印版 Probability and Statistics(Open+Free)stanford 怎么着也不是很差https://www. coursera.org/learn/prob ability-intro Courseracom/e du/python/introduction数据分析与数据挖掘工程师,需要掌握哪些必备工具? 对于数据分析来说:Step1:①重点函数学习 重点是了解各种函数:Vlookup、sum,count,sumif,countif,find,if,left/right,时间日期函数、文本函数。②数据透视表学习 如果Excel只能学习一个功能,那唯一能入选的就是数据透视表。掌握vlookup和数据透视表是最具性价比的两个技巧。学会vlookup,SQL中的join,Python中的merge很容易理解。Step2:数据可视化 所用工具:PowerBi、Excel 数据分析界有一句经典名言,字不如表,表不如图。数据可视化是数据分析的主要方向之一。Step3:数据库学习 所用工具:SQL Excel对十万条以内的数据处理起来没有问题,但是互联网行业就是不缺数据。但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。越来越多的产品和运营岗位,会在招聘条件中,将会SQL作为优先的加分项。对于数据挖掘来说:1、需要一定的数学知识,最基本的比如线性代数、高等代数、凸优化、概率论等。2、需要掌握各种基础的算法,比如SVM,逻辑回归。3、编程能力 语言包括Python、Java、C或者C++,我自己用Python或者Java比较多。有时用MapReduce写程序,再用Hadoop或者Hyp来处理数据,如果用Python的话会和Spark相结合。掌握了这些,你离数据分析,数据推荐算法工程师与数据挖掘工程师有什么区别?它们日常工作内容有什么不同? 作为一名推荐算法工程师讲讲我的主要工作…1.搞数据,但算法工程师的搞数据主要指做样本,即为了让算法学到更有价值的东西我们来根据数据库中的数据来选择不同的字段作为特征喂给算法,说白了就是怎么用数据。2.目前推荐业务主要使用深度学习算法,我们会跟踪业界最新的论文等研究是否这些模型适合我们的业务场景来落地实现。3.为了最低延迟的线上即时服务,设计好的工程架构也是很重要的。4.对着学习曲线发呆,琢磨到底他喵的怎么就没效果了。

#大数据#数据分析#数据挖掘#数据挖掘算法#文本挖掘

随机阅读

qrcode
访问手机版