标签专题 · 共 4 篇文章

# LPU

关于「LPU」的技术文章、设计资料与工程师讨论,持续更新。

4
篇文章
13
人关注
227
次浏览
端侧 AI 推理三国杀

端侧 AI 推理三国杀

2026年的AI圈,有一个消息让全行业震动:英伟达豪掷200亿美金收购Groq,坚定押注HBM+LPU的协同路线,试图垄断从云端到边缘的全场景推理算力。而与此同时,AI行业正面临一个普遍困境——AI快用不起了!智谱、Anthropic等大模型机构密集涨价、调整计费模式,背后的核心症结,正是端侧AI推理的底层架构瓶颈。 如今,全球端侧AI推理赛道已经悄然分成了三条截然不同的路线,分别由英伟达、高通和

NVIDIA 人工智能开讲 | GTC26 回顾:详解 AI 的五层蛋糕(上集)

欢迎收听 NVIDIA 人工智能开讲,本系列节目特邀 NVIDIA 中国区高级技术市场经理施澄秋和懂芯 ChipWise 创始人、资深行业媒体人张慧娟,以 NVIDIA CEO 黄仁勋提出的 “AI 五层蛋糕” 架构(能源 — 芯片 — 基础设施 — 模型 — 应用)为主线,深入解读 GTC 2026 的重点发布:从推理拐点、 Token 经济学,到 Vera Rubin、LPU,再到 NemoC

GPU和LPU,谁才是AI“最优解”?读完这篇你也能说清。

GPU和LPU,谁才是AI“最优解”?读完这篇你也能说清。

本文介绍了GPU和LPU的区别与各自适用场景。 众所周知,AI芯片领域,英伟达GPU一家独大,但最近有个新选手跳出来叫板——LPU,专门做大语言模型处理(LLM)的新架构。 这玩意到底是黑科技还是炒概念?今天咱就硬核拆解,谁才是AI的最优解,看完你就懂了。 核心结论先给你撂这:GPU仍是全能扛把子,LPU是LLM推理领域的专门杀手,如果你只做大语言模型推理,LPU现在已经比GPU更强。但是做LLM

英伟达GTC大会的核心看点,谁是最大受益方?

英伟达GTC大会的核心看点,谁是最大受益方?

老黄演讲后,网上很多博主都发了关于GTC的内容,但是绝大多数都是新闻性质的,他们只讲了黄仁勋都说了啥。这篇文章我们结合 NVIDIA 的技术规划,来聊一聊网上可能没有的分析和GTC的核心看点。对于万亿营收和CPO的信息,都是大家知道的了,这篇文章就不再赘述了。 1、CPX的黯然退场 在上个月下旬的时候,网上还依然传着很多关于 CPX 要使用 HBM 的传言。我当时就听到消息说 CPX 要取消,我当