标签专题 · 共 8 篇文章

# AI推理

关于「AI推理」的技术文章、设计资料与工程师讨论，持续更新。

篇文章

人关注

415

次浏览

关注标签

全部技术资讯资料帖子问答视频

NVIDIA CEO 黄仁勋在戴尔科技全球峰会上表示：“需求正迎来抛物线式增长，完全是抛物线式的”

本周一，黄仁勋与戴尔 CEO Michael Dell 共同登台，发布了 Dell AI Factory with NVIDIA 的最新更新 —— 旨在为自主智能体提供从桌面工作站到数据中心机架的全栈平台。借助 NVIDIA Vera Rubin 平台，代理式 AI 推理的每 Token 成本降低至原来的十分之一。运行在 NVIDIA Vera 的智能体沙盒，相比于在传统 CPU 上的运行速度

2026-05-21 AI推理自主智能体 AI基础设施 747 0

报告详解 | 五大核心洞察：AI 时代 Arm 的关键价值

人工智能 (AI) 已不再是孤立的技术门类，而是融入各类设备、企业工作流程与云基础设施的底层能力。在此背景下，行业面临的核心挑战，已不再局限于打造性能更强的 AI 模型，而是如何在实际业务环境中实现高效部署与规模化落地。 Moor Insights and Strategy 最新发布的《从设备到云端：AI 时代 Arm 的关键价值 (From Devices to the Cloud: Arm’s

2026-05-19 Arm架构 AI推理 AI基础设施 806 0

DRAM短缺下的边缘AI：以有限资源实现更高性能

内存市场今年面临严峻挑战。由于制造商优先为数据中心和大规模AI工作负载供应DDR5和高带宽内存(HBM)，内存供应趋紧，成本大幅飙升：与2025年第三季度相比，价格已上涨了3至4倍，且市场信号表明价格峰值尚未到来。据报道，即便是通常处于市场优先级的超大规模云厂商，也仅获得了约70%的分配容量。分析师预计，这种紧张局面将贯穿2026年全年，甚至可能延续至2027年。这种压力并非均匀分布。价格涨幅

2026-05-09 DRAM 边缘AI 无DRAM AI加速器 75 0

边缘AI应用爆火集成NPU的SoC成为市场新宠

AI技术的普及不仅推动着以大模型训练为核心应用的大算力基础设施市场繁荣，同时也极大推动了边缘AI应用的快速普及。随着边缘AI应用场景的不断丰富，终端设备对核心处理器的要求已不再局限于基础的计算与控制功能，而是升级为“AI推理算力、低功耗、高集成、高可靠”的综合能力比拼。在此行业变革背景下，集成NPU的SoC产品异军突起，通过将CPU、NPU、GPU、ISP、存储控制器、接口模块等核心组件集成于单一

2026-05-08 边缘AI NPU SoC 119 0

ASIC vs GPU：算力时代怎么选？看完这张对比表就不纠结了

数字时代里，算力就是推动技术进步的核心引擎。ASIC芯片和GPU作为两种最核心的算力载体，各自在特定领域都有着不可替代的优势。今天就把两者的技术差异、性能特点和适用场景说透，不管你是挖矿、做AI还是搞高性能计算，都能得到专业的参考。 1. 先给核心结论 ASIC是为单一任务优化的专用芯片，GPU是面向通用并行计算的灵活方案，两者没有绝对好坏，只看你用在什么地方。核心差异我整理了一张对比表，一目了

2026-05-07 ASIC GPU AI推理 97 0

能养龙虾的工作站CPU和GPU，需要具备哪些能力？

[ ](https://mp.weixin.qq.com/s?__biz=MzIxMDE0NTM0Nw==&mid=2649358184&idx=3&sn=83907863a30de303c57f3c565305c6bb&scene=21#wechat_redirect) 因为有AI的加成，强调AI能力的工作站出货量今年预计会增长65.2%(数据来源：IDC)。恰好

2026-05-04 至强600 Arc Pro B70 AMX指令集 107 0

摩尔线程 x 中国移动｜国产GPU率先支撑央企大模型，S5000完成九天35B大模型适配

近日，中国移动自主研发的九天35B通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 “AI 能力联合舰队” 的核心算力成员，摩尔线程基于旗舰级AI训推一体全功能GPU MTT S5000，依托成熟的MUSA软件栈与高性能算子优化，已率先完成九天35B模型的全流程适配与推理验证。这不仅是国产GPU与央企大模型的深度协同，更意味着国产AI算力已具备支撑行业级大模型规模化落地的核心能力。软硬协

2026-04-28 国产GPU MUSA软件栈大模型适配 111 0

AI热潮下NAND闪存的命运逆转

存储器行业素以强周期性著称，如今再次站在十字路口。这一切始于几年前的人工智能(AI)热潮：当时，高带宽内存(HBM)与AI加速器一同成为训练模型的首选。作为DRAM的一种特殊形式，HBM的利润率远高于NAND闪存。面对NAND价格下跌、利润缩水的困境，三星和SK海力士等大型厂商在扩大NAND产能上变得愈发谨慎。技术层面同样挑战重重。随着NAND闪存层数突破200层大关，每一代新产品都需要先进的制

2026-04-26 NAND闪存 HBM AI推理 102 0

1 雷军强烈建议大家现在就换手机 2 晶体管转移特性曲线详解：核心参数及应用 3 5亿视频炼出全球最大 GUI 开源数据集、推理 Token 省71%小模型反超大模型——小米 AI 团队多篇论文入选 ICML 2026 4 智慧芯片的主力军，紫光展锐发布UniClaw智能体 5 重磅｜华为发布源网荷储AIDC战略，引领产业未来 6 ISE14.7兼容性问题集锦 7 2026 China Fabless 100上市公司排名解读（最终版） 8 黑芝麻智能华山A2000U、A2000X获ISO 26262 ASIL-D最高功能安全认证

「AI推理」是纳米网电子工程技术社区的热门标签，涵盖相关的技术文章、设计方案和工程师讨论。目前已收录 8 篇优质内容，持续为电子工程师提供专业参考。