标签专题 · 共 1 篇文章

# DSA+DSP架构

关于「DSA+DSP架构」的技术文章、设计资料与工程师讨论,持续更新。

1
篇文章
4
人关注
86
次浏览

Tech Talk热点Q&A汇总 | “周易”X3 NPU IP R2新版本

Q1 “周易”X3 R2 NPU IP支持FP4且算力翻倍,主要是满足什么样的需求? A 1.在W4A8和W4A16两种主流大模型量化精度下,单Cluster算力从80 TFLOPS跃升至160 TFLOPS,且支持灵活配置,算力密度提升超70%,能够让客户在相同芯片面积下获得更强的AI性能; 2.边端侧推理正从W4A16向W4A8演进,FP4数据格式的支持正是为未来FP4权重模型的出现做好前瞻准