ZKX's LAB

英特尔的16:打通从硬件到应用的中间层

2020-11-30新闻2

IT时报记者 王昕

在美国汉堡王,当用户点餐下单时,AI算法记录下用户的点餐顺序,并据此推荐薯条或甜品等;在韩国首尔,5G用户的每次电话和上网都被记录下来,并由AI分析预测网络质量,并进行异常告警;在腾讯游戏的数据中心,一台至强服务器加上两块SG1显卡支撑着上百路《王者荣耀》等云游戏的超低延时运行……所有这些应用都奔跑在英特尔提供的软硬件多层系统平台上,“大数据+AI”所散发的计算、存储、效率、兼容性等优势被展现得淋漓尽致。

oneAPI:开发者最熟悉的“新朋友”

软件在英特尔生态中扮演中间层的重要角色。“因为云计算的介入,应用场景变得越来越复杂,从应用程序开发商到硬件的中间层越来越厚。”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清表示,过去英特尔的软件支持只要达到操作系统层面就可以,但现在整个软件深度已经远远超过过去,所以英特尔需要在CPU、GPU、AI等用户场景都提供有厚度的、有穿透力的软件支撑。

制程与封装、XPU架构、内存和存储、互联、安全和软件是英特尔的六大技术支柱。作为英特尔技术内涵的1/6,谢晓清表示,英特尔希望通过软件释放硬件的全面潜能,除了非常丰富X86平台的生态系统之外,oneAPI是英特尔推出的强力支持异构计算的平台软件,“我们希望利用oneAPI使得开发者在软件方面的投资可以最大程度复用,不需要绑定在单一的硬件架构以及制程上,并且开发效率也可以得到最大化。”

据介绍,今年12月,英特尔将发布全新的oneAPI Gold版本,DPC++编译器、所有系统库、工具包都会与开发者见面。

谢晓清介绍,oneAPI主要的价值在于提供给用户非常友好的编程环境,使得开发者可以自由选择硬件平台;同时,英特尔提供的编译器、系统都高度优化,可以实现最大的硬件产能,并且最优支持不同异构计算的硬件加速,“oneAPI的开发模式非常快速、高效,源代码的维护成本也将达到最低。”

对于熟悉英特尔产品的开发者来说,oneAPI其实并不陌生,整个平台都是英特尔在几十年在CPU的生态当中建立起来的,对许多开发者来说是耳熟能详的产品。“我们现在做的是把它们从CPU领域扩展到GPU领域,或者以后还会扩展到其他的异构计算的领域。”谢晓清透露,一切努力都是为了发挥硬件最大的性能优势,“12月发布的oneAPI版本会支持CPU和GPU,以后还会支持其他AI硬件和FPGA等。”

“至强+SG1+容器云”领跑安卓云游技术方案

谢晓清认为,整个信息时代正快速进入人工智能时代,而在这个时代微软、安卓、iOS等新老生态伙伴都会融合在一起,同时,开源社区发展也非常快速,比如Kubernetes、Kata Containers、KVM和云产品提供商VMware,以及亚马逊AWS、阿里巴巴、微软Azure等都是非常重要的合作伙伴。

英特尔的目的是要让应用程度和AI开发商可以快速穿透中间层对接硬件层。目前,英特尔基于oneAPI支持一些AI的工具包包括Hadoop、Spark、TensorFlow、PyTorch、PaddlePaddle、OpenVINO等。

当英特尔的软件生态拥抱异构的过程中,“从CPU到GPU”始终是非常重要的一步。

“英特尔最新发布的GPU—SG1在安卓云游戏的框架上起了非常重要的作用。”谢晓清介绍,由于SG1数据中心级强大的图形渲染能力以及多媒体编解码能力,使得我们有可能利用独立GPU把云游戏的图形界面在云端直接渲染,并且利用流媒体的方式,把它编码之后直接发布到游戏终端。

在云游戏场景下,至强处理器和轻量级容器云的结合提供了云端协同的杀手级应用。谢晓清强调:“特尔在安卓的框架层和运行层都做了非常多的创新和优化,使得英特尔安卓容器化方案拥有很高的密度,并在业界保持领先。”

据悉,上述方案有望在腾讯云游戏实现产品化。腾讯云评价,英特尔基于至强服务器和SG1独立显卡的方案是一个高密度、低延迟、低功耗和低成本的解决方案,当一台至强服务器被加上两块SG1显卡时,可以跑高于100路的云游戏。该方案适用于《王者荣耀》《传说对决》等最热门游戏。

天猫精灵是另一个潜在应用场景。阿里巴巴天猫精灵团队评价,英特尔的方案能够短时间内高效完成高密度、低成本、端到端的用户体验,实现高性能云应用平台整体上线,达成云、边、端一体化,打造全新的客户体验。

数据、AI的“云边端”超级融合

数据是英特尔转型的大方向,而AI则是应对庞大数据流的不二法门。当各行各业的工业和商业客户面对新的数据和AI时代时,如何高效、无缝、可扩展地将新的AI算法应用到现有的大数据平台上,成为大量企业的“AI之痛”。

对阿里云、腾讯云、万事达卡、银联、美的等公司和品牌来说,Analytics Zoo可以端到端地帮助它们将“大数据分析+流水线”应用到实际生产环境当中。

英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长介绍戴金权,Analytics Zoo是英特尔开源“大数据+AI”软件平台,构建在oneAPI又或是Python库等深度学习框架,以及如Spark、Flink、Ray等数据处理分析框架之上。

Analytics Zoo的能力分为三层:提供端到端的数据流水线能力的“底层”、提供机器学习工作流的“中间层”和构建海量应用场景的“上层”。戴金权介绍,实际上,Analytics Zoo“大数据+AI”平台已经商用于非常丰富的场景中。

在美国汉堡王,当顾客开始点单,收银员把商品输入到客户订单中时,汉堡王希望构建一个模型,能够将这些点单的行为以及相关的信息可以收集起来,进而后续对用户进行进一步甜品、小食、饮料等推荐。一开始,汉堡王为此构建了深度学习和大数据处理两个模型,但效率非常低下,后来,在与英特尔合作之后,汉堡王将整个端到端的数据处理和模型训练全都迁移到基于Analytics Zoo的统一平台上,利用Spark、Mxnet、Ray等进行数据处理、分析、分布式模型、训练等,大大提高了AI和数据处理效率。

SK电信是韩国最大的电信公司,遍布城市的4G、5G基站每秒可以生成140多万条网络质量记录,SK电信为此构建了一个复杂的大数据平台。但令SK电信头疼的是,从基站到系统后台,端到端产生了海量需要传输、拷贝的数据流,同时每几秒都会产生新的数据,有时这些数据非常重要,AI需要借此重新评估当前的网络质量。

为此,SK电信与英特尔合作,将整个架构迁移到Analytics Zoo平台上来,直接在Spark集群上对数据进行处理,并存储在内存当中,分布在整个集群上,随后再直接利用TensorFlow模型基于内存上的数据来进行训练和推理。

结果,SK比对发现,Analytics Zoo将整个端到端的统一流水线基于内存数据进行边缘处理,最终,“SK电信在推理上实现了3~6倍的性能提升,而训练最高可以达到4倍提升。”

#英特尔#AI人工智能#5g

qrcode
访问手机版