ZKX's LAB

Zebra将GPU代码迁移至FPGA,AI效率翻倍

2020-11-25新闻5

Xilinx FPGA上的sology Zebra工具在ML推理引擎效率方面优于GPU和ASIC。近日,机器学习软件开发商Mipsology发布了基于Zebra FPGA人工智能加速器MLPerf推理基准测试的结果。

人工智能软件初创公司Mipsology正与Xilinx合作,使FPGA能够仅使用一个额外的命令就可以替换AI加速器应用程序中的GPU。Mipsology的“zero effort”软件Zebra将GPU代码转换为在FPGA上运行Mipsology的AI计算引擎,而无需进行任何代码更改或重新培训。

Zebra运行在Xilinx Alveo U250加速器卡上,其峰值性能效率是其他商用加速器(无论是GP还是专用的AI 边缘芯片)的两倍多。简单来讲,Xilinx最新版本的Alveo数据中心加速卡,与Mipsology的Zebra软件一样,能转换GPU AI代码,可同时在FPGA上运行

Mipsology的首席执行官和创始人Ludovic Larzul表示:“很高兴我们的架构被证明是所有测试过的现有解决方案中计算神经网络最有效的,并且在ML Perf的‘closed’类别中达到了最高要求。”“无需设计特定的芯片,也无需利用FPGA的可编程逻辑,我们也能击败英伟达、谷歌、AWS和阿里巴巴等巨头,以及Groq等资金雄厚的初创公司。或许该行业应该停止对TOPS的过度追求,如果未能发挥它的足够价值,那么400+ TOPS的硅意义何在?”

多年来TOPS峰值一直是衡量计算性能潜力的标准,因此许多人认为更多的Peak等于更高的性能。然而,这没有考虑到架构的实际效率,以及在某些时候收益递减的事实。当电路由于现有的限制而无法使用时,这种现象就会发生,类似于电源的“dark silicon”,也叫“暗硅”现象。Zebra证明,与TOPS一起进行扩展时,在峰值TOPS增长的同时也能保持相同高效率。

Xilinx将为Zebra制作最新版本的Alveo U50卡,其峰值达到了38.3。据悉,Zebra已经在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。

U250加速器卡在每个顶级流量方面显著超过竞争对手,并在当今最好的加速器中排名前列。根据MLPerf v0.7推断结果,它提供了与NVIDIA T4类似的性能,但它的最高性能比NVIDIA T4少3.5倍。在与GPU相同数量的TOPS上,它将提供3.5倍的吞吐量,或比TPU v3高6.5倍。而且这种性能不会以改变神经网络为代价。

MLPerf基准测试避免了任何神经网络更改、高精度修剪技术或其他需要用户干预的方法。Zebra在保持TensorFlow和Pytorch框架可编程性的同时实现了这一效率。

Xilinx AI和软件副总裁Ramine Roane:“Mipsology在Xilinx Alveo平台上的Zebra AI推理加速为开发人员在神经网络推理计算方面提供了一个可靠的区分器,与Zebra相结合,Alveo U50满足了AI工作负载的灵活性和性能需求,并为任何部署提供了高吞吐量和低延迟性能优势。Zebra赋予我们的adaptive Alveo平台比其他产品(包括GPU)更高的计算效率。”

据了解,Mipsology成立于2015年,约有30人在法国从事研发工作,在加州有一个小团队主要负责业务开发。该公司已获得总额700万美元的资金,其中200万美元是2019年法国政府创新竞赛的奖金。

Mipsology的核心团队来自EVE——Synopsys于2012年收购的一家ASIC仿真器公司,该公司生产Zebra硬件辅助验证产品。据称,几乎所有主要的ASIC公司都使用EVE技术在设计周期内验证ASIC;这项技术依赖于连接在一起的数千个FPGA来重现ASIC的行为。

Mipsology有12项专利正在申请中,与Xilinx密切合作,并兼容第三方加速卡,如Western Digital small-form factor(SFF U.2)卡和Advantech卡(如Vega-4001)。

#技术编程

随机阅读

qrcode
访问手机版