阿里造芯往事

来源:是说芯语 产业分析 8 次阅读
摘要:2026年3月,在阿里巴巴财报分析师电话会上,CEO吴泳铭公布了一组数据:旗下芯片公司平头哥已累计交付47万片自研芯片,其中六成以上销售给外部客户,年化营收达到百亿级别。他还提到,不排除IPO的可能。 关于平头哥上市,阿里尚未明确时间表,但资本市场的预期已经被点燃。年初,摩根大通就在研报中,给出250亿到620亿美元的估值区间。 八年前,完全是另一番景象。2018年夏天,时任阿里集团CTO、达摩院

2026年3月,在阿里巴巴财报分析师电话会上,CEO吴泳铭公布了一组数据:旗下芯片公司平头哥已累计交付47万片自研芯片,其中六成以上销售给外部客户,年化营收达到百亿级别。他还提到,不排除IPO的可能。

关于平头哥上市,阿里尚未明确时间表,但资本市场的预期已经被点燃。年初,摩根大通就在研报中,给出250亿到620亿美元的估值区间。

八年前,完全是另一番景象。2018年夏天,时任阿里集团CTO、达摩院院长的张建锋接受《麻省理工科技评论》采访时表示:“我们就像被人卡住了脖子,连呼吸都不自由。”

那时,阿里云的服务器CPU几乎全靠英特尔,算力加速卡要向英伟达采购。同年4月,中兴通讯遭受美国制裁,中国科技界对供应链安全的警觉骤然绷紧。

当一家中国互联网巨头发现自己的命脉捏在别人手里,它该怎么办?从2018年到2026年,阿里花了八年时间,试图回答这道题。

一家电商公司想要造芯片

造芯的故事,要从造云讲起。

2008年,马云从微软亚洲研究院挖来一位叫王坚的心理学博士,任命他为阿里首席架构师。王坚不会写代码,这在当时的技术圈引起了不小的骚动。

那时候,阿里和所有中国互联网公司一样,面前横亘着三座大山:IBM的小型机、Oracle的数据库、EMC的存储。业内管这叫“IOE”。阿里每年都要向这些海外巨头,支付一大笔软硬件费用。

最先让中国互联网公司感到“卡脖子”的,其实不是芯片,是这些软硬件基础设施。

王坚给马云算了一笔账:按当时阿里的发展速度,十年后,光是服务器和数据库的采购费用,就足以拖垮公司。

为此,王坚在内部启动了“去IOE”工程,方向是云计算,并立下铁规:从2010年起,不再购买小型机。

2008年的中国几乎没人知道云计算该怎么做。当时,亚马逊的AWS才刚起步,国内连一个像样的云服务都没有。2010年深圳IT领袖峰会上,李彦宏说云计算是“新瓶装旧酒”,马化腾说要等上几百年甚至一千年。

王坚带着团队从零开始搭建“飞天”操作系统。没人知道这条路该怎么走,每一个技术决策都可能出错。阿里云首任技术总监林晨曦后来形容:“就像一支军队在攻占一个看起来不可能攻克的山头,一批冲锋者倒下了,下一批接着顶上。”

林晨曦从集团其他业务线拉来了一些内部客户试用,其中包括阿里金融。但系统极不稳定,经常每隔几小时就崩溃一次。

最难熬的是2010年到2012年。飞天系统必须突破“5K”瓶颈(单集群调度5000台服务器)。团队没日没夜地干,换来的却是一个接一个的系统故障。来自各业务线的怒火对准王坚。

2011年底,时任阿里金融总裁的胡晓明带着团队找到王坚。他们先是集体鞠躬,然后下了通牒:如果春节期间系统再出问题,阿里金融将放弃使用阿里云。

让一个心理学博士来主导公司的底层技术架构,阿里内部很多人想不通。

阿里内网上,有人发帖说:“马云,你被王坚忽悠了,阿里云根本不可能实现!”这篇帖子迅速获得了2000多个点赞。那几年,阿里云连续拿集团最低分,离职率高达七八成。有员工在辞职信里写:“我觉得再干下去,也看不到任何希望。”

在一片谩骂声中,马云亲自回复了那篇帖子:“博士是人,不是神!给他一点时间。”他定下的基调是,每年投10个亿,连续投10年,做不出来再说。

从2009年到2013年,阿里云在试错中前行。2013年5月,阿里集团最后一台IBM小型机在支付宝下线。同年7月,淘宝最后一个Oracle数据库下线。8月,飞天系统突破5000台,阿里云成为全球首个对外提供5K云计算服务能力的公司。

王坚后来当选中国工程院院士,成了民营企业里的第一人。

他主要解决了软件层面的问题,把阿里从IBM和Oracle的生态绑定里解放了出来。

但核心的底层芯片仍然掌握在国外厂商手中。想要真正把命运掌握在自己手里,阿里还必须去另一层“芯”。

生死一赌

2018年4月,美国商务部对中兴通讯发出制裁禁令。消息像一盆冰水浇在整个中国科技界头上。

对阿里而言,危机感更为具体。阿里云的数据中心里,成千上万台服务器昼夜运转,CPU印着Intel的Logo,加速卡贴着NVIDIA的标签。如果断供,这朵亚洲最大的公有云将面临瘫痪。

张建锋说的“呼吸不自由”,正是这种悬顶之剑下的焦虑。

阿里在芯片领域的布局比外界知道的要早。2015年,阿里接触了杭州中天微系统有限公司。这家公司手握近百项发明专利,是当时国内唯一拥有自主嵌入式CPU架构并实现大规模量产的芯片设计公司,但产品主要卖给智慧城市、智能家居这些预算有限的领域。

阿里看中了它的技术底子,双方合作开发“云芯片”。此后阿里两度注资,成为其第一大股东。

中兴事件后,阿里迅速行动,于2018年4月全资收购中天微。同年9月的云栖大会上,阿里将中天微与达摩院自研芯片团队整合,成立独立的芯片公司“平头哥半导体”。CTO张建锋决定从头搭建一套完全开源、不受外国管辖的算力底座。

图|张建锋在2018年云栖大会上宣布平头哥成立

关于名字,团队原本提议叫“蜂鸟”,寓意小而快。马云改成了“平头哥”。平头哥是蜜獾在中国网络文化里的昵称,体型不大,但狮子豺狼都不怕,被公认为“世界上最无所畏惧的动物”。马云认为芯片江湖凶险,需要这种“不服就干”的劲头。

公司成立后,摆在平头哥面前的第一个难题是:走哪条路?

当时数据中心里跑的主流芯片,几乎都基于一种叫x86的架构。这套规则是英特尔和AMD在几十年前写定的,专利墙高筑,外人根本进不去。想造x86芯片,得先向他们买授权,费用高到足以让一家初创公司直接破产。万一哪天欧美一纸禁令下来,授权说停就停。

这条路,说到底还是给别人打工。

平头哥内部开了一场决定命运的大会。十几位负责人围坐一桌,争论要不要押注RISC-V。这是一种完全开源的芯片架构,任何人都可以拿去用,不用交专利费,也没有人能单方面收回你的使用权。

但这个架构还太年轻,性能跟不上,软件生态几乎为零。做出来的芯片,大概率只用在温湿度传感器、智能门锁上。

中天微自研的C-Sky体系已经耕耘多年,并且实现了大规模量产,放弃它去押注一个“新玩具”,等于把已经跑通的生意推倒重来。

经过多轮激烈讨论,十几位负责人全票通过了RISC-V。理由只有一个:即使遭遇最极端制裁,这套架构也不会断供。

“选择RISC-V不是为了追求技术先进,而是为了生存。”一位参与决策的平头哥早期员工后来回忆,“我们需要一个绝对安全的‘逃生通道’。”

孟建熠是中天微出身,后来成为平头哥半导体技术负责人。2016年,他参加了RISC-V在中国的第一次峰会,现场来了五六百人。“一个新生的架构,就能吸引这么多人,说明它有很强的生命力。”他回忆。

2019年7月,平头哥发布玄铁910,成为当时性能最强的RISC-V IP核之一,但更多是技术验证。当时几乎没人相信RISC-V能撑起高性能计算。

更务实的一条线,也在同步进行。2021年云栖大会,平头哥推出了倚天710。这颗芯片没有采用RISC-V,而是ARM架构。

ARM是由一家英国公司写好规则,然后卖授权给苹果、高通、华为这些公司。它最大的特点是低功耗,全球手机芯片几乎全是ARM架构。平头哥用ARM做倚天710,走的是务实的中间路线,生态成熟、能快速出货。

这是阿里第一颗“为云而生”的CPU,5nm工艺,600亿晶体管,性能超越同期业界标杆20%以上。张建锋在发布会上明确表态:“这颗芯片不出售,主要是阿里云自用”。

不对外卖,只给自己用,既保证了自己有底牌,又不至于跟英特尔、AMD撕破脸。到2022年底,倚天710已在阿里云数据中心大规模部署。

就在阿里刚刚在传统云计算芯片领域站稳脚跟时,新的风暴来了。2022年底,ChatGPT横空出世,全球科技竞争的焦点骤然转向AI大模型。

这一次,被卡住的“脖子”,换成了AI算力的核心GPU。

自研芯片如何走出阿里

大模型时代,算力的硬通货是GPU,而全球的供给几乎被英伟达垄断。2022年后,美国接连出台的出口管制措施,使得国内企业连英伟达的“特供版”芯片都一卡难求。

阿里再次被逼到墙角。外购无门,转向国产AI芯片厂商时,又遇到了另一种尴尬。

2023年前后,国内三大运营商正大力建设智算中心。他们采购量大、价格不敏感,成为芯片厂商眼中的香饽饽。相比之下,阿里这种既懂技术、又对性能和成本极度挑剔的互联网大厂,反倒成了“难伺候”的客户

有国产芯片厂商的销售私下表示,运营商的订单利润高、交付简单,优先级自然排在阿里前面。

“花钱都当不了大爷,那就只能自己动手。”一位接近平头哥的人士说。

其实阿里自研通用GPU(内部代号PPU)的计划启动更早。大约在2020年,项目就已秘密立项,由达摩院计算技术实验室核心团队负责。2023年初,PPU就在阿里内部完成了研发和场景验证,但团队选择了沉默。

不同于“AI芯片四小龙”高调融资、频繁发声,阿里既无融资压力,也不愿过早亮底牌。从2020年到2025年底,几乎没有对外透露任何消息。

转机出现在2025年9月。美国媒体The Information爆料,平头哥PPU性能已接近英伟达H20。

几乎同期,央视《新闻联播》画面中出现该芯片参数:96GB HBM2e显存、700GB/s片间互联带宽、整卡功耗400W。纸面指标已超过当时主流的A800和多数国产GPU。

2026年1月29日,这颗芯片亮相。平头哥官网上线产品页,正式命名为“真武810E”。官方信息显示,它已在阿里云多个万卡集群部署,用于通义千问的训练与推理。

市场真正关心的其实是,自研芯片到底能不能独立赚钱?

很长时间里,外界质疑平头哥只是“阿里内部的降本工具”。含光800主要用于淘宝搜索,玄铁多服务于阿里生态IoT,倚天710也只自用。

2024年之后,局面变了。

2025年,平头哥中标中国联通“三江源绿电智算中心”项目,总签约算力3579P,其中平头哥提供1945P,占比54%。这是国产AI芯片首次在国家级智算项目中拿下过半份额。

同年,小鹏汽车和比亚迪分别下了超万片的PPU外部订单。到2026年初,平头哥外部客户已超过400家,覆盖金融、能源、汽车、政务等多个领域。IDC数据显示,2025年上半年国产AI芯片市场,华为昇腾居首,平头哥位列第二。

一位阿里云销售透露,对某些互联网公司的推荐算法业务,使用平头哥芯片能把推理成本降低20%以上。性价比,成为打开外部市场的关键武器。

这意味着,平头哥的芯片已不再只是内部“备胎”,已经具备了真正对外商业化的能力。

2026年3月24日玄铁C950发布会上,达摩院同时推出Vector和Matrix加速引擎,让RISC-V CPU首次原生支持Qwen3、DeepSeek V3等千亿参数大模型。中国工程院院士倪光南在现场表示,RISC-V正从“备选”走向“主流”。

图|玄铁C950发布会现场

同月,阿里云宣布对真武810E等自研算力产品提价5%-34%。有了自研芯片托底,定价权终于回到自己手里。

至此,阿里手中凑齐了三张牌:平头哥的算力芯片、阿里云的平台、通义大模型。内部将其称为“通云哥”战略,构成了一个从底层芯片到云计算、再到上层AI应用的全栈闭环。

目前全球范围内,能打通“芯片-云-大模型-应用”全链条的公司屈指可数。除了手握TPU的谷歌,微软、亚马逊、Meta等巨头至今仍大量依赖英伟达芯片。

2026年4月,吴泳铭在内部信中宣布成立集团技术委员会并亲自担任组长,同时升级通义大模型事业部。他提出目标:未来五年,云和AI商业化收入(含MaaS)突破1000亿美元。

从当年担心被“卡脖子”,到逐步掌握部分算力自主能力,阿里走了一条漫长且充满不确定的路。

这条造芯路,很难被简单地归结为一个关于技术突破的励志故事。它更像一家中国公司在复杂全球供应链中,给自己建一块缓冲带的长期尝试。

相关标签: 暂无标签
相关推荐
评论区

登录后即可参与讨论

立即登录