随着智能产业的发展日趋成熟,大量企业在奔赴智能化升级的前线,深度学习方兴未艾,深度学习框架也开始为更多开发者所知。其中佼佼者如TensorFlow、PyTorch、MXNet等已经获得了大量的关注,而作为后起之秀,华为开源项目MindSpore也一样在今年获得广泛关注,那么其在开源和开发者运营方面有哪些独到之处呢?华为计算开源开发与运营部副总监,MindSpore开源社区运营负责人黄之鹏在接受CSDN专访时对此进行了解答。
后来而崛起,快速成长的MindSpore
当记者问及MindSpore的开源情况时,黄之鹏对其整体进行了介绍。MindSpore在开源之时选择了一条不太寻常的路径,其主仓选择在码云进行开源开发,同时华为内部自研了机器人能够将托管在码云的代码在GitHub和iHub搬运并建立实时镜像仓,开发者也可以在三者中可以任选其一参与。
码云为主仓可以理解,但是另外打造两个镜像仓对于MindSpore有何意义呢?黄之鹏回答表示,GitHub是全球最大的社交编程及代码托管网站,镜像仓有助于国内外开发者更快的接触到MindSpore;而iHub托管平台由鹏城实验室这一国家级实验室推出之后,汇聚了大量优质的AI开源项目和镜像,其在AI方面亲和度颇高。
从今年3月28日开源以来,MindSpore获得了开发者的广泛关注。在GitHub官方提供的TrendingRepositories是目前开源领域最具权威性的榜单之一,官方会对各个开源项目的star数、fork数、提交数、follow数以及项目页面浏览量等数据每天会进行8次统计,并根据结果刷新该页面。虽然GitHub不是MindSpore的主仓,但是MindSpore依然多次登上了C++的日榜、周榜和月榜,这无疑是开发者对该项目热忱的一种体现。
MindSpore能够有如此表现,黄之鹏认为不仅仅是社区的功劳,这也与当前国内环境有很大关系。当前国内人工智能产业都处于起飞阶段,这意味着数据集、模型等创新处于爆发前夕,整体AI市场在扩大,开发者不需要存量竞争,MindSpore也不需要和已经成熟的开源深度学习框架竞争。因此MindSpore可以把精力投入到社区构建中去,持续赋能和培养新的开发者,给予开发者更多的生态机会,打造相关商业应用案例,实现场景落地,进而推动整个行业的进步。
而如今人工智能技术落地领域颇多,在各个行业中的应用表现不一,那么MindSpore会给产业带来哪些新变化呢?黄之鹏表示,MindSpore在设计时就具备了开发态友好、运行态高效、部署态便捷的特点,其能够帮助开发者快速上手;同时,其还是业界少见的面向端边云全场景的深度学习框架,能够提供自动并行、图算融合等能力,能够适用于大规模集群环境等诸多的场景之中。
高效运营,充分发挥开源力量
开源是一种态度,同时也是一种力量的聚集。不过开源并非万事大吉,没有合理和高效的运营手段,很可能会让开源项目渐趋平庸。黄之鹏则告诉记者,MindSpore在开源社区的运营方面非常用心,因而使得社区整体活力和发展呈现一种更加高效的状态。
开源是一个节点,没有技术的积累谈开源无异于无稽之谈。黄之鹏表示与其他开源项目相比,MindSpore在开源之后节奏非常快,基本上可以做到每个月发布一个版本的状态。对于MindSpore这种体量的产品来讲,这种速度几乎不可思议,但其客观上也体现了华为做完全开源深度学习框架的决心。不过好在,决心大力量足,MindSpore研发团队在这种以月为周期的版本发布中保障了项目的质量,因此在开源后才为开发者提供了一个良好的开源平台。
MindSpore在开源后很快收获了开发者的反馈并发现了发现更多的适用场景,比如一些开发者表示大规模集群环境的适应堪称开发的好助手,尤其是自动并行和自动微分能力,非常适合解决科学计算、分子动力学、量子化学等科研场景中涉及的高阶求导问题。
技术和运营是开源社区不变的两大核心。在技术方面,MindSpore采用了软硬件协同的系统化设计方案,提供覆盖端边云的全场景能力,能够帮助用户更好、更简单的接入生态;同时,MindSpore针对华为的主要硬件进行了深度的性能优化,比如MindSpore在量化训练方面持续进行训练调优,使得整体性能达到一个非常高的标准,满足用户产品竞争需求,同时端边云统一的框架可以实现云端量化训练得到的模型,可以直接在手机或者IoT等终端使用,这就是MindSpore能够带来的一大变化。
运营方面,MindSpore社区团队也在持续的进行努力,他们组织了大量的线上线下的各类活动,并且在全球各大城市中聚集开发者人群组织成立了MSG(MindSporeStudyGroup)。该组织内部会提供大量的在线直播课程,并且以丰富的手段让开发者快速了解MindSpore并上手使用。
基于社区,创造更多价值
MindSpore开源后赋能的不止是开发者,还有更多的合作伙伴。MindSpore与鹏城实验室合作共同打造了一套智慧医疗体系,能够把图像识别等人工智能场景的能力赋能给医疗机构;与深圳湾实验室合作的项目中,MindSpore的深度学习能力被应用在分子动力学与深度学习的结合研究中;同时,目前全球用户超过4亿的华为手机,所使用的AI功能也大多是基于MindSporeLite所支撑的MLKit所使能。MindSpore在开源前,或许有技术可靠但生态不够完善的弊端;但开源后,MindSpore把代码放在开源社区,大众所见即所得,开发者无论在论坛、微信群还是QQ群等渠道,所提出的一切有价值的内容,最后都会闭环到Gitee或者Github的bugfix或者featureproposal上。这就让其用户量实现进一步增加,有人用才有生态,开源让MindSpore的生态得以腾飞。
那么如果是中小型企业想要接入MindSpore,有哪些途径可选呢?黄之鹏表示目前MindSpore主要有两种途径来为企业赋能。第一种是参与在昇腾开发者生态活动中定期举办一些面向初创企业以及中小型企业的定制化赋能活动及培训,可以从中针对一些优质合作项目针对MindSpore实现快速赋能;
第二种则是基于开源项目,通过开源社区与企业达成合作。举例而言,不久前在MindSpore社区里刚产生了第一个开源的ISV初创企业名为JINA.AI,其便能够提供基于云原生的神经网络搜索引擎,其创始人便是在AI界久负盛名的肖涵老师,并且这一合作完全是基于社区打造,所有解决方案全部开源,这一合作的达成对于国内开源产业上来讲意义非凡,其可以被视为国内开源成熟的标志之一。
开源社区,开放是核心。黄之鹏表示:"MindSpore是一个开发者第一的社区,对于开发者的提问我们的研发团队会第一时间进行答复,开发者的反馈和体验社区也特别重视,并且MindSpore开源项目的开发是纯开源模式,完全按照开源方式运营,所有人名单公开,补丁提交等也能够一视同仁,不存在通过只有主创企业的员工才有的用户名密码、或者要拍肩膀托关系的这些非开源方式才能提交代码和参与社区。"
让黄之鹏引以为傲的是,MindSpore可能是国内的第一个采用开放社区治理的深度学习开源框架。在MindSpore社区里,有着非常完善的章程,社区治理架构的技术治理委员会是由中美欧三地的14名专家组成,下面还包括了各种社区人员、补丁提交等相关的评审小组,流程都在社区公开的邮件列表中,一切决定都有标准化的章程作为依照。公开和开放成为了MindSpore社区发展的规则,只要社区共建者有足够的技术基础,那么便不会有任何制约的因素存在。
在黄之鹏看来,MindSpore的开放使得社区能够快速发展。通过待每一个开发者以耐心和认真,MindSpore获得了开发者的支持;通过对技术的执着和开放,MindSpore得以后来而起成为深度学习开源框架领域不容忽视的一股力量;通过昇腾生态和开源生态的融合,MindSpore为各方合作伙伴提供了更具潜力的发展空间。开源七个月,MindSpore还有很长的时间去更上一层楼。