ZKX's LAB

为什么在中国搞不出 Spark 和 Hadoop 这种东西? spark贡献者

2021-03-21知识3

有什么关于 Spark 的书推荐 作者都是Spark的主要贡献者:Learning Spark:Lightning-Fast Big Data Analysishttp://www.amazon.com/Learning-Spark-Lightning-Fast-Data-Analysis/dp/1449358624/这本书有这样几个特点:可操作性强:安装好Spark后,就可以直接照着书中的例子进行实际操作,Learning by doing,比直接看Spark的论文来得要简单爽快。类似于初学Linux也不一定得先把操作系统原理学得彻彻底底了才开始动手;带着问题边干边学不断深入才会效率高。实例充实:提供了Scala、Python、Java三种接口的操作代码,提供了诸如PageRank算法的实现,并在在How to的基础上加入了大量Why to的讨论,讨论如何在Spark分布式环境下实现更高效的计算,如何减少网络开销。github上也有作者提供的配套代码:databricks/learning-spark·GitHub文字扼要:比官方文档(SparkProgramming Guide)更深入地介绍代码作用原理,同时也不像普通外文教材一样废话连篇。例如这一句:“为分布式数据集选择正确的分区策略的重要性类似于为本地数据选择正确的数据结构。让人思考良久。

Apache Flink和Apache Spark发展前景分别怎样? 关于这个,可以参见我Quora的回答:Quora-The best answer to anyquestion How-does-Apache-Spark-work/answer/Reynold-Xin Flink以前名字叫做Stratosphere,其实和Spark。

想要了解 Google、亚马逊等公司最前沿的技术可以去哪些网站? http://www. cloudera.com/blog/ Dropbox San Francisco,CAhttps:// tech.dropbox.com/ Facebook Menlo Park,CAhttps:// developers.facebook.com /blog/ FourSquare 。

为什么在中国搞不出 Spark 和 Hadoop 这种东西? spark贡献者

为什么在中国搞不出 Spark 和 Hadoop 这种东西?

#spark贡献者

随机阅读

qrcode
访问手机版