标签专题 · 共 6 篇文章

# DeepSeek-V4

关于「DeepSeek-V4」的技术文章、设计资料与工程师讨论，持续更新。

篇文章

人关注

321

次浏览

关注标签

全部技术资讯资料帖子问答视频

华为DCS AI解决方案全面支持DeepSeek-V4

4月24日，DeepSeek-V4预览版正式推出并开源，将模型上下文窗口提升至1M，并引入KV Cache滑窗与压缩算法，有效缓解Attention计算复杂度与访存带宽压力，智能体能力大幅提高，在长序列推理与复杂任务处理中的表现更加高效与稳定，但新模型对基础设施也提出了新的挑战。华为DCS AI解决方案集成华为AI软硬件产品，发挥全栈优势，针对DeepSeek-V4进行深度适配，完成系统级优化和易

2026-04-26 DeepSeek-V4 KV Cache 算力调度 159 0

摩尔线程S5000 + 智源FlagOS｜Day-0适配DeepSeek-V4 Pro和Flash双模型，并发布镜像

4月24日，摩尔线程联合北京智源人工智能研究院，基于旗舰级AI训推一体智算卡MTT S5000与FlagOS全栈软件体系，**完成DeepSeek-V4系列两款模型推理“Day-0”适配，并在魔搭社区正式发布Pro和Flash两个版本的镜像**，为开发者与行业用户带来开箱即用的国产化部署方案。 ▼ DeepSeek-V4-Pro镜像地址： https://modelscope.cn/models/

2026-04-26 DeepSeek-V4 MTT S5000 FP8 166 0

DeepSeek V4发布：1M上下文白送，华为芯片直供

4月24日，中国人工智能公司DeepSeek正式发布并开源全新系列模型DeepSeek-V4预览版。该系列包含Pro与Flash两个版本，均支持百万字（1M）超长上下文。官方表示，V4在Agent能力、世界知识和推理性能三大维度上达到国内与开源领域领先水平，其中Pro版本性能可比肩世界顶级闭源模型。双版本矩阵：旗舰对标顶尖，Flash普惠经济 DeepSeek-V4采用MoE（混合专家）架构

2026-04-26 DeepSeek-V4 MoE架构 1M上下文 170 0

Day-0支持｜摩尔线程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

4月24日，摩尔线程宣布，其基于TileLang 0.1.8版本深度优化并已成为TileLang官方主线版本的TileLang-MUSA，已率先在国产全功能GPU上，实现对DeepSeek-V4最新TileLang算子库TileKernels的“Day-0”支持，为大模型关键算子的快速迁移、验证与性能优化奠定了可直接复用的工程基础。 ▼ TileKernels算子库开源地址： https://gi

2026-04-25 TileLang MUSA TileKernels 107 0

摩尔线程 × 上海AI实验室｜基于S5000和KernelSwift实现DeepSeek-V4核心算子Day-0适配

今日，DeepSeek-V4预览版正式发布并开源。摩尔线程携手上海 AI 实验室 DeepLink 团队，通过大模型驱动的智能算子迁移系统 KernelSwift，率先在旗舰级AI训推一体智算卡 MTT S5000 上完成了核心算子的Day-0适配。目前算子通过率已超80%，真正实现了模型发布与国产算力适配的同步落地。这一成果不仅为开发者提供了无缝部署体验，更彰显了 KernelSwift 与 M

2026-04-25 DeepSeek-V4 KernelSwift MTT S5000 200 0

DeepSeek-V4发布，华为云首发适配

4月24日，DeepSeek-V4模型正式发布并开源，华为云首发适配。DeepSeek-V4拥有百万Token超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。其中，DeepSeek-V4-Flash模型参数下降至284B，推理成本进一步降低，模型参数和激活更小，V4-Flash能够提供更加快捷、经济的API服务，实现百万上下文普惠。当前，华为云MaaS模型即服务平台已

2026-04-25 DeepSeek-V4 KVCache 昇腾高性能算子 156 0

1 雷军强烈建议大家现在就换手机 2 5亿视频炼出全球最大 GUI 开源数据集、推理 Token 省71%小模型反超大模型——小米 AI 团队多篇论文入选 ICML 2026 3 什么是Teflon（特氟龙）？ 4 晶体管转移特性曲线详解：核心参数及应用 5 重磅｜华为发布源网荷储AIDC战略，引领产业未来 6 ISE14.7兼容性问题集锦 7 智慧芯片的主力军，紫光展锐发布UniClaw智能体 8 一块 ESP32，能被 Claude 开发者玩出什么花样？

「DeepSeek-V4」是纳米网电子工程技术社区的热门标签，涵盖相关的技术文章、设计方案和工程师讨论。目前已收录 6 篇优质内容，持续为电子工程师提供专业参考。