Hadoop、spark、SaaS、PaaS、IaaS、云计算概念区分? 比如Gmail:给你邮件软件直接用,http:// github.com :给你版本控制软件直接用,Office 365:给你办公软件用,Photoshop Express:给你修图软件用。《黑客与画家》讲了。
大数据常用的开发工具有哪些 1Apache HiveHive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和处理等。Hive提供了一种简单的类似SQL的查询语言—HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。2.Apache SparkApache Spark是Hadoop开源生态系统的新成员。它提供了一个比Hive更快的查询引擎,因为它依赖于自己的数据处理框架而不是依靠Hadoop的HDFS服务。同时,它还用于事件流处理、实时查询和机器学习等方面。3.Jaspersoft BI 套件Jaspersoft包是一个通过数据库列生成报表的开源软件。行业领导者发现Jaspersoft软件是一流的,许多企业已经使用它来将SQL表转化为pdf,这使每个人都可以在会议上对其进行审议。另外,JasperReports提供了一个连接配置单元来替代HBase。4.Keen IOKeen IO是个强大的移动应用分析工具。开发者只需要简单到一行代码,就可以跟踪他们想要的关于他们应用的任何信息。开发者接下来只需要做一些Dashboard或者查询的工作就可以了。5.Mortar DataMortar Data是专为开发者打造的Hadoop开发平台,它用Pig和Python的组合替代了MapReduce以便开发者能简单地编写Hadoop管道(Pipeline。