随着AI模型的不断演进,算力需求6年增长30万倍,增长速度从两年翻一番提升到3、4个月翻一番,这是OpenAI以及斯坦福报告《AIINDEX2019》对于在2012年-2019年内算力需求的变化。
时至今日,AI产业规模正保持着高增长的趋势。有关数据显示,预计2020年,我国AI核心产业规模将超过1500亿元,增长率达到26.2%,至2030年,我国AI核心产业规模将超过10000亿元。而在规模增长的背后,产业内技术/应用开发和落地等对于算力的需求也正在不断刷新纪录,对于云计算而言,是一个不小的挑战。
为了进一步了解当下的云计算,围绕这一领域,镁客网对北京超级云计算中心产品总监AI智算云产品负责人赵鸿冰博士进行了采访。
图 | 北京超级云计算中心产品总监AI智算云产品负责人赵鸿冰博士
可以注意到,在整个采访过程中,有一个观点是赵鸿冰从始至终都在表达的,也是希望能够被更多算力需求者所明白的——与其自建算力平台,不如拥抱AI智算云计算这一先进形态。
“云计算虽然已经发展的颇有一些年了,大家对于这个词也已经可以说是耳熟能详,甚至似乎有给人一种过气的感觉,但实际上,整个传统IT支撑形态向云计算的转化还没有达到一个很好的高度。”赵鸿冰表示,从一些统计数据来看看,所呈现的结果或许是传统IT与云计算各分半壁江山等,但在现实的市场中,前者依旧是许多客户群体的固有形态。
目前,在算力支撑这一基础设施建设问题上,主要有两种形态,一种是传统自建,另一种则是云计算,简单而言,前者为自给自足,后者则是借助第三方服务达到事倍功半的目的。
在采访中,赵鸿冰也向镁客网解释了“传统自建”模式所带来的问题,主要体现在精力的无谓消耗,以及高闲置率带来的低性价比问题。
“尤其在一些科研高校,因为本身的规模量不是特别大,他们就会容易形成这样一个思维,认为自己买两台计算机回来改造一下,就构成计算平台了。”赵鸿冰表示。
图 | AI智算云操作平台
其实不然,计算机仅仅是算力平台搭建过程中的很小的一部分,另外还需要覆盖IDC、UPS、操作系统、平台框架等等,而它的搭建也是有一个周期过程的,少则三个月至半年,多则需要两至三年,期间的工作包括调研、选型、采购、招投标、实施等。也因此“在这种传统形态下,导致科研工作者的一些时间精力被无谓的花费在这些底层基础设施的搭建上,而一定程度上耽误了本身在应用领域的研究。”
与此同时,或许会有人觉得租用算力的费用可能会有会偏贵,但是综合考虑自建所需要的资源购买、基础支撑开销、运维开销以及利用率等,“较之租用第三方云计算服务,自建形态中平摊到每个月的消费甚至会高出一倍。”
为了佐证这一观点,赵鸿冰也拿出案例表示,依据他们在2019年拿到的一个数据,一年的1至12月份,传统自建算力平台的使用率约达到30%,因此他们的资源在约三分之二的时间内是被闲置的,从而导致投入产出比特别低,而这一点是租用第三方云计算服务所能够避免的。
“我们想表达的核心观点是,让专业的人干专业的事,由我们去把整个算力平台下方的基础设施保障提供到位,让优秀的科研工作者能够去专心做上层面的、更有价值的科研工作。这一观点是我们过去一点时间,以及接下来一段时间,所要持续表达的。”
众所周知,“新基建”的提出为下一步基础设施建设指明了目标和方向,所涉及领域也是众多复杂。而在这其中,云计算承担的责任不可谓不大。
以“新基建”中的信息基础设施为例,它主要包括通信网络基础设施、新技术基础设施和算力基础设施,云计算无一例外都是其中的关键要素。
“毋庸置疑,新基建的提出对于我们来说是一个非常好的事情,这是国家在向高科技经济转型,从整个政策的引导到落地都非常清晰,各个地方的项目都在不断上线,到了一个落地的阶段。”赵鸿冰表示。
当然,“在这样的大趋势下,势必也会带来一些挑战。在国家政策导向出来之后,客户的一些行业应用场景也会向这个方向有所偏移和发展,客户的需求变多、需求复杂度变高。”
图 | AI智算云操作平台
针对算力需求的暴增,北京超级云计算中心主要通过“厂网结合”的模式做到灵活应变,最终实现依据客户需求做到算力的按需输出。
依据赵鸿冰的解释,具体来看,所谓的“厂”可以理解为将北京超级云计算中心比作一座算力电厂,按照电厂的逻辑、市场化的行为,去灵活的供应算力。“这一模式对于供应链管理、整体组织架构形态是具有挑战的,而这是我们的核心能力之一。”
至于“网”,“北京超级云计算中心同时也隶属于中国超算云平台下,后者是一个多云架构,是一个由北京超级云计算中心、各大超算中心、国家网格资源等多个云计算中心组成的平台。”
在这一平台下,“北京超级云计算中心可以通过‘网’进行一个调度,以应用云为例,届时以SaaS的方式,用户最终只需要考虑自己需要多少算力,至于具体的计算部分,可以依据具体情况灵活分配到某个超算中心,且过程完全透明。”赵鸿冰称。而通过这样一种“厂网结合”的模式,北京超级云计算中心即可以弹性满足客户的算力需求。
目前,北京超级云计算中心主要面向的还是一些相对更纯粹的算力需求,客户群体包括科研院所、企业研究院等等。而这一定位,也它与其他大型云服务厂商区分开来。
与此同时,赵鸿冰也补充道,相对于BAT等大型云服务厂商,北京超级云计算中心旗下产品“AI智算云”主要有4点优势。
“我们是‘厂网结合’模式,这使得我们在资源方面非常的丰富,譬如GPU,我们拥有A100、V100、P100、P40、T4等12、13种型号,而其他厂商根据企业需求可能只有3、4种,这保证我们能够更多满足客户对GPU类型的需求。”赵鸿冰详细说到。
“面向客户,我们也针对细分阶段打造了一些特别简单易用的平台,当客户有需求时,不需要再像在其他平台那样,从数百款产品中找寻自己所需要的平台,而是直接就提供一个简单直观的平台。”此外的两点优势分别是7*24小时的服务体系,及以更具优势的价格提供同等质量的服务。
而围绕这4点优势,赵鸿冰总结为20个字:资源丰富、随需供应、平台易用、服务贴心、质优价优。