标签专题 · 共 2 篇文章

# AI推理

关于「AI推理」的技术文章、设计资料与工程师讨论,持续更新。

2
篇文章
7
人关注
133
次浏览
NVIDIA CEO 黄仁勋在戴尔科技全球峰会上表示:“需求正迎来抛物线式增长,完全是抛物线式的”

NVIDIA CEO 黄仁勋在戴尔科技全球峰会上表示:“需求正迎来抛物线式增长,完全是抛物线式的”

本周一,黄仁勋与戴尔 CEO Michael Dell 共同登台,发布了 Dell AI Factory with NVIDIA 的最新更新 —— 旨在为自主智能体提供从桌面工作站到数据中心机架的全栈平台。 借助 NVIDIA Vera Rubin 平台,代理式 AI 推理的每 Token 成本降低至原来的十分之一。运行在 NVIDIA Vera 的智能体沙盒,相比于在传统 CPU 上的运行速度

摩尔线程 x 中国移动|国产GPU率先支撑央企大模型,S5000完成九天35B大模型适配

近日,中国移动自主研发的九天35B通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 “AI 能力联合舰队” 的核心算力成员,摩尔线程基于旗舰级AI训推一体全功能GPU MTT S5000,依托成熟的MUSA软件栈与高性能算子优化,已率先完成九天35B模型的全流程适配与推理验证。这不仅是国产GPU与央企大模型的深度协同,更意味着国产AI算力已具备支撑行业级大模型规模化落地的核心能力。 软硬协