亚搏亚搏

欢迎光临
我们一直在努力

一家英国明星芯片公司“悄然”入华!叫板英伟达A100

“核算革新在核算机历史上只发生过三次,第一次是 70 时代的 CPU,第2次是 90 时代的 GPU,而 Graphcore 便是第三次革新,他们的芯片是这个国际伟大新架构的一种。”说这话的是 ARM 公司开创人、英国半导体之父赫尔曼·豪瑟。

他口中的 Graphcore,是来自英国的 AI 芯片公司。这家公司兴办于2016年,在芯片范畴有着多年经历的奈杰尔·图恩担任联合开创人和 CEO,曾兴办过两家处理器公司的西蒙·诺尔斯担任联合开创人和 CTO。

图 | Graphcore

这家分公司遍及多个国家和地区的公司,于 2019 年进入我国。9 月 19 日,DeepTech 和 Graphcore 高档副总裁兼我国区总经理卢涛,就相关问题进行了沟通。

图 | 卢涛

他表明,Graphcore 的首要技能是以 IPU 处理器、为 IPU 打造的 Poplar 软件。根据 IPU 处理器和 Poplar 软件栈,Graphcore 的产品最终以用在IPU服务器中的PCIe 卡、IPU 体系产品 IPU-Machine 和 IPU-POD 的方式出现给用户。

Graphcore 现已取得了一些阶段性开展。截止现在,IPU 已到达一万多片的发货规划,并服务于全球超越 100 家的组织,其首要运用在互联网大规划数据中心、高校和科研组织等。一起,IPU 也在支撑医疗、金融、生命科学、轿车、金融和核算范畴方面的运用。

2019 年头,AI 教父杰夫·欣顿在承受记者采访的时分,被问未来什么样的核算体系会更像大脑?他的答复是:“我以为咱们需求转向不同类型的核算机。走运的是,我这里有一个...” 欣顿伸手进入他的钱包,拿出一个又大又亮的硅片——一个 Graphcore IPU 芯片。

IPU带来可持续开展途径

2016 年,全球 AI 工业进入高速开展阶段。在曩昔,大约每隔三个月,模型参数规划就会进步一倍。2018 年 10 月,谷歌的 ResNet 模型有 3.3 亿个参数。2019 年3 月,OPEN AI 的大型言语模型 GPT-2 到达 15.5 亿个参数。2020 年,GPT-3 到达 1750 亿个参数。GPT-3 模型完结一次完好练习,要消耗千万美金等级的花销。这样的密布核算,很难带来持续开展。那么,是否有可持续开展的途径?

在论文《EfficientNet:对卷积神经网络的模型缩放的从头考虑》中,论文作者通过平衡神经网络的深度、宽度、准确率,再通过找到平衡点、并把底层卷积改动之后,找到了大幅减小参数数量的办法,与此一起准确度也得到提高。卢涛以为,这是未来的代表方向之一。

2020 年上半年,微软机器学习科学家 Sujeeth Bharadwaj 共享了 IPU 练习 CXR 模型的杰出功能,IPU 在运转微软 COVID-19 印象剖析算法 EfficientNet 和SONIC 时体现亮眼,在 30 分钟内完结了英伟达传统芯片需 5 个小时的练习工作量。

图 | 微软用IPU和GPU练习用于新冠算法模型的比照

从 Graphcore 的视点来看,不论是 CPU 仍是 GPU,都不是针对 AI 运用而生。CPU 是标量处理器,它首要做模仿性判别,用于协助程序员针对固定形式进行编程。CPU 特别合适的架构是通过许多的模仿处理器开发手机 App 和外包服务器。GPU 是针对图画处理而生,比较 CPU 来说 GPU 在并行度和向量机上都有很大提高。

归纳来说,GPU 首要运用在干流 AI 渠道,它并不是为 AI 而生的处理器。Graphcore 进行许多剖析后发现,AI 核算具有高度并行、低密度核算等特色,不论做图画处理模型、仍是言语处理模型,都会在底层表达到一个核算图。卢涛以为,真实面向未来的 AI 处理器,有必要是针对核算图来进行处理,而 Graphcore 的IPU 正是以核算图为中心的智能处理器。

三项革新性技能:核算、数据、通讯

进入我国后,Graphcore 一向尽力挨近开发者,卢涛在 9 月 19 日中关村论坛的讲演结束,特意说到该公司在中文网站 graphcore.cn、微信和知乎的开发者立异社区,并鼓舞更多开发者来到上述渠道,获取 Graphcore 的资源和支撑来进行立异。

对此做法,他解说称,Graphcore 期望将权力移交给立异者。那么,首要要给立异者供给新的渠道,让他有新的可能性。假如开发者的算法不合适 GPU,并不一定代表你的算法无效,而是你需求一个新渠道。根据此,Graphcore 供给了十分先进的AI 处理器、以及大规划 IPU 集群体系。

2020 年 7 月 15 日,Graphcore 发布根据 7nm 的第二代 IPU 处理器——GC200,以及用于 Mk2m IPU 和 IPU 体系产品的技能:核算、数据、通讯。

图 | GC200

GC200 根据台积电 7nm 工艺,有 594 亿个晶体管,是当时单一芯片最大规划的处理器。GC200 依然连续了第一代的“同构众核”架构,所不同的是,制作工艺从16nm,提高为最新的 7nm。

GC200 的处理器片上存储也从 300MB 提高到 900MB,晶体管数量超出英伟达2020 年 5 月发布最新旗舰 A100。GC200 的处理器中心从上一代的 1217 提高到1472,能履行 8832 个独自的并行线程,体系功能提高 8 倍以上。在数据处理方面,GC200 连续之前的高带宽高容量体现,这关于应对一些杂乱 AI 模型及算法很有协助,官方表明它可支撑具有数千亿个参数的最大模型。

此外,Graphcore 还初次提出 IPU-EXCHANGE-MEMORY,这是一种交换式的贮存架构。Graphcore 在 M2000 每个 IPU-Machine 里边通过 IPU-Exchange-Memory 技能,供给了将近超越 100 倍的带宽以及大约 10 倍的容量,这关于许多杂乱的 AI 模型算法是十分有协助的。

针对 AI 核算集群,Graphcore 打造了 IPU-Fabric 技能,这是为 AI 横向扩展而生的通讯技能,它的长处是弹性大、低时延。有了 IPU-Fabric 之后,用户能够轻松构建出超低弹性的核算渠道。M2000 是 Graphcore 推出的根据 GC200 的刀片型服务器,每片能供给 1PetaFlop 的算力支撑。M2000 能够被看作是 Graphcore IPU 体系产品布置的最小单元,根据它能够很方便地创立各种规划的集群。

图| IPU-Fabric

Graphcore 协同 IPU 从零打造了一个以图为笼统编程模型的软件 Poplar。通过这套软件 SDK,不论是运用浪潮仍是戴尔的服务器,更或者是运用单个 M2000 以及大规划核算体系 IPU-POD,Graphcore 都能运用同一套软件进行编程。

Graphcore 还在 Poplar 层面上,供给了许多软件库。以神经网络库为例,其能够支撑规范的 PyTorch、TensorFlow 与 ONNX 等。一起,Graphcore 以为,对一个体系而言,运维和办理也十分重要。为此,Graphcore 根据开源做了集群办理套件。

在整个处理器研制过程中,Graphcore 以为敞开十分重要。卢涛表明,开源是因为立异需求对底层有许多可见度。Graphcore 以为要把权力移交给开发者,并于2020 年 7 月开源了一切的核算图库源代码和机器学习算法模型。

在构建社区方面,Graphcore 在金山云上构建了一个开发者云,其首要面向商业用户、高校、科研组织和个人研究者。卢涛表明,这一且都是为了协助立异者,能够在在机器智能中完成下一波打破,以及协助用户完成在 CPU、GPU 上没有办法完成的立异。

Graphcore 至今成立了四年多的时刻,期间已得到红杉本钱的支撑,也获得了宝马、博世、微软、三星、DELL 等企业的出资。通过几年的开展,Graphcore 现已开展为遍及全球的组织。

关于参加我国,该公司开创人奈杰尔·图恩表明:“有远见的我国公司现已开端着手布局自己在 AI 范畴的蓝图。或许这便是为什么 Graphcore 在我国找到了热心,并如此深度的参加。Graphcore 现已开端为一些颇有建树的我国公司供给技能支撑,并将助力推进我国那些开展最快、最具立异性的 AI 草创企业。”

卢涛也对 DeepTech 表明,我国的企业十分拿手把立异进行大批量的快速落地布置,Graphcore 觉得我国是最大的商场之一。在快速落地布置中,Graphcore 也能够进一步打磨自己的产品。此外,IPU 也能协助用户开释出更多潜能,今天在CPU 和 GPU 上做欠好的工作,在 IPU 上可能会开释极大潜力。

赞( 396 )
未经允许不得转载: 亚搏 » 一家英国明星芯片公司“悄然”入华!叫板英伟达A100