亚马逊云科技就开始自研芯片

作者:老胡说科技 在整个云计算领域,能让芯片规模化的用起来,是决定造芯是否成功的天花板。在拉斯维加斯的亚...


在整个云计算领域,能让芯片规模化的用起来,是决定造芯是否成功的天花板。在拉斯维加斯的亚马逊云科技 2023 re:Invent 则是完美诠释了这一论调。

亚马逊云科技 2023 re:Invent 开幕前两个小时,有一场小型的欢迎晚宴,《星期日泰晤士报》南非站记者 Arthur Goldstuck 谈到:" 我们可能会目睹最重要的一场 re:Invent,这次亚马逊云科技的技术发布,在未来五年都会是极具意义的。"

参与者们好奇,在生成式 AI 几乎席卷一切的背景下,一个处于领导者地位的云厂商,将会向外界讲出怎样的人工智能故事?

如果站在未来看当下,生成式 AI 可能是一场大型马拉松,但亚马逊云科技现在就已经在勾勒出它的地图。在亚马逊云科技 CEO Adam Selipsky 长达两个半小时的演讲中,一张 " 生成式 AI 技术堆栈图 " 图贯穿了整场。

亚马逊云科技就开始自研芯片

亚马逊云科技 " 生成式 AI 技术堆栈图 "(Generative AI Stack)

从上图可见,亚马逊云科技搭建了三层 AI 堆栈:最底层是用于训练和推理的「基础设施层」,这里包括一些亚马逊云科技的自研芯片;中间层是微调大模型或基础模型需求的「工具层」;最上层是「生成式 AI 应用层」,这里包括此次新推出的生成式 AI 助理 Amazon Q。

概括而言,亚马逊云科技正在构建一种范式,去尽可能匹配这个时代下的更多客户的更多需求,正如 Adam Selipsky 所说—— " 我们在用一种跟传统完全不同的方式探讨生成式 AI 概念 "。

不过,正所谓见微知著,我们决定将「芯片」,作为观察今年亚马逊云科技 re:Invent 新发布的切入点。

亚马逊云科技就开始自研芯片

摄于 2023 re:Invent 一角

十年自研,逆向造芯

很多人了解亚马逊云科技,知道它是全球领先云厂商,构建底层软件的能力非同一般。但大家可能不那么了解的是,亚马逊云科技还是一个在芯片及硬件层有深厚技术底蕴的公司。

早在十年前的 2013 年起,亚马逊云科技就开始自研芯片,至今已形成了一个芯片全家桶,包括四个系列:

构成云服务技术底层核心的虚拟化芯片 Amazon Nitro 通用处理器芯片 Amazon Graviton 用于机器学习的 " 训练 " 芯片 Amazon Trainium 和用于机器学习的 " 推理 " 芯片 Amazon Inferentia

而且实际上,近年来亚马逊云科技一直在年中举办 " 亚马逊云科技硅芯片创新日 ",与产业交流相关创新。就在今年 6 月的 2023 年芯片创新日,Amazon EC2 副总裁 Dave Brown 回忆起 2012 年,当时亚马逊云科技是如何进入芯片设计的故事。一晃,已是十年。

他描述了一群领导者,包括 Peter DeSantis 和 James Hamilton,如何设想 " 增加一个硬件设备来增强亚马逊云科技的安全性和性能 " ——这个简单的想法,开启了一个全新的时代,带来了多种定制的芯片产品。

而在此次 re:Invent,就有两款亚马逊云科技自研芯片有了重大升级,分别是:

Amazon Graviton4Amazon Trainium2

亚马逊云科技就开始自研芯片

Amazon Graviton4 和 Amazon Trainium ( 原型 ) ( Business Wire 提供 )

Amazon Graviton 系列芯片,无疑是芯片发展史上浓墨重彩的发明。提起 ARM 架构的云端芯片,大家似乎不陌生。但如果把时钟拨回到 6 年前,虽然当时业界已经通过 iPhone,认可了 ARM 架构是移动端 CPU 的好选择。但是,开发并规模化商用 ARM 架构的服务器 CPU,还是前无古人的创举。

而亚马逊云科技就是那个开创者,Amazon Graviton 第一代诞生于 2018 年," 现在接近 10% 的服务器总销售额是 ARM,其中很大一部分来自亚马逊云科技。在 CPU 方面,这家公司做得很好。"Bernstein Research 高级分析师 Stacy Rasgon 在一次接受采访中如是说。

本次大会,Amazon Graviton 已经更新到第四代,但依然没有放慢高速增长的步伐。据悉,与前一代相比,Amazon Graviton4 性能提升 30%,独立核心增加 50%,对于高并发等应用所需要的内存带宽,更提升 75%,并且,还进一步通过高速物理硬件接口的完全加密提升了安全性。

亚马逊云科技就开始自研芯片

熟悉造芯的朋友们都知道,设计和成功流片一颗新架构的芯片只是造芯的基本功,而能让芯片规模化的用起来,才是决定造芯是否成功的天花板。

在管理理念上,亚马逊内部有一招很特别的法门,叫做 "working backwards 逆向工作法 "。亚马逊云科技的成功造芯,或许正与此有关。

发表评论
加载中...

相关文章