不造GPU也能破局算力内卷?

来源:是说芯语 人工智能 51 次阅读
摘要:摩天大楼的骨架出了问题,光换砖头是没有用的。中国AI算力领域正面临着同样的困局:GPU卡越来越强,但整机系统的算力利用率却始终上不去。传统的以CPU为中心的计算机架构,让AI大模型在跑起来时频频“堵车”。容芯致远看准这个痛点,创始团队全部来自清华电子工程系,瞄准了AI基础设施的底层架构。 近日,容芯致远宣布完成数亿元天使轮融资,由北京绿色能源和低碳产业基金与赛富投资基金领投,顺禧基金、富华资本、万

摩天大楼的骨架出了问题,光换砖头是没有用的。中国AI算力领域正面临着同样的困局:GPU卡越来越强,但整机系统的算力利用率却始终上不去。传统的以CPU为中心的计算机架构,让AI大模型在跑起来时频频“堵车”。容芯致远看准这个痛点,创始团队全部来自清华电子工程系,瞄准了AI基础设施的底层架构。

近日,容芯致远宣布完成数亿元天使轮融资,由北京绿色能源和低碳产业基金与赛富投资基金领投,顺禧基金、富华资本、万利达集团、长江创新投、水木清华校友基金、梅花创投等多家机构跟投。云岫资本此前参与了种子轮,本轮继续跟投并担任长期独家财务顾问。这家成立仅两年的公司,尚未推出产品就已经集结了一支堪称豪华的投资阵容,颇受资本市场注目。

| 把计算机的“骨架”彻底翻过来:从CPU中心到GPU中心

传统的计算机架构是以CPU为“大脑”来指挥一切,GPU仅仅是个“打工”的执行者。然而在训练AI大模型时,超过95%的计算任务需要GPU来完成,让CPU继续做“总指挥”,反而成了整个系统的瓶颈。

容芯致远的做法听上去很反常识:他们不造GPU,而是把计算机的整个“骨架”从CPU切换为GPU——设计一种叫作AGC(AI computer system with the GPU as its Core)的智算架构。据悉,系统中GPU与CPU的比例可由传统的2:1提升至20:1甚至32:1。这也是赛富投资基金管理合伙人蒋驰华所强调的:“光靠芯片制程的演进已经撑不住了,只有系统级的架构颠覆才是破局的关键所在。”

| 像换U盘一样换显卡:把AI算力设备的可用性拉到99.99%

除了提升算力密度,容芯致远还从硬件可靠性、维护效率和能源利用三个方面着手设计了突破性的解决方案。其中,容芯致远自研AI BMC管理系统,可将传统轮询机制下数秒级的响应压缩至微秒级。在可靠性方面,AGC架构下单机可实现最多20个GPU的冗余热备,当一块GPU故障时,冗余GPU可在约1分钟内接替任务,而传统架构下恢复一块故障卡至少需要2个小时,停机维修更是家常便饭。这套被命名为GPU-RAID的方案,直接把单台AI服务器可用性从85%拉到了惊人的99.99%。

同时,公司还针对GPU卡做单点电源管理,非工作时段自动休眠以延长GPU平均使用寿命。

| 从实验室到产线:K系列产品拿下国产算力实战大单

这些听起来像物理教科书的技术,并非只停留在PPT上。容芯致远的K系列产品曾获得北京市颠覆性技术创新奖,已在油田、政务、涉密部门以及科研领域成功落地。在与燧原科技等国产芯片厂商的联合测试中,采用AGC架构跑DeepSeek 671B满血版时,竟可节省近50%的硬件资源。K系列搭载预置推理环境并支持RAG检索,为企业提供了开箱即用的AI算力终端。

值得关注的是,容芯致远还联合中国开放指令生态联盟成立了“RISC-V国产智算体系结构创新专业组”,首批15家成员单位共同推动技术标准化。容芯致远将相关知识产权向产业链开放共享,力图在算力体系中走出一条“中国标准”的道路。

云岫资本创始合伙人高超对此评价称:“它开启了中国AI计算机系统架构创新的一种新范式。”

当GPU从配角变为主角时,围绕它去重构一切,这将是算力行业无法绕开的一步。从清华电子工程系走出的这支技术老兵团队,正走在一条“不寻常”的路上。

合作洽谈,进入公众号:服务—>商务合作

相关推荐
评论区

登录后即可参与讨论

立即登录