标签专题 · 共 12 篇文章

# 大模型

关于「大模型」的技术文章、设计资料与工程师讨论，持续更新。

篇文章

人关注

603

次浏览

关注标签

全部技术资讯资料帖子问答视频

谷歌阿里争锋，华为掉队，百度抢位

AI全栈，一定是少数者的游戏。 AI即将迎来它的“寡头时代”。执掌阿里的吴泳铭明确表示：阿里全栈AI技术投入已正式跨越初期培育阶段，进入正向的规模商业化回报周期。意思是，AI能帮阿里赚钱了。但帮其赚钱的不仅仅是千问、也不仅仅是阿里云，而是凭借“自研平头哥芯片+千问大模型+阿里云+应用生态”形成的全栈AI能力。而目前像阿里一样依靠AI全栈能力“稳坐中军帐”的厂商，全球只有大洋彼岸的谷歌。当A

2026-05-18 AI全栈大模型自研芯片 1,909 0

5月4日，坐拥3.45亿月度活跃用户的AI应用豆包，在App Store更新付费订阅声明的消息登上微博热搜。根据声明，豆包将推出三档付费会员：标准版连续包月68元、加强版200元、专业版500元，年费分别为688元、2048元和5088元。豆包官方随后回应称，基础版完全免费，日常聊天、文案撰写、信息查询等核心功能不受影响，付费功能主要聚焦PPT生成、数据分析、影视制作等复杂任务和生产力场景，相关方

2026-05-16 生成式AI 大模型 AI算力 1,991 0

前Qwen负责人林俊旸创业，目标融资规模为数亿美元

据The Information报道，前阿里通义千问Qwen核心负责人林俊旸正在为其新成立的AI实验室寻求融资，目标融资规模为数亿美元。高榕资本和红杉中国正在洽谈参与本轮融资，如果交易完成，这家尚处早期的新AI实验室估值可能达到约20亿美元。不过相关谈判仍在进行中，最终融资金额和估值仍可能发生变化。有分析认为，此次林俊旸开启自主创业，在无营收、无产品的情况下，纯靠团队和创业方向便被估值百亿元，

2026-05-15 通义千问 Qwen 大模型 2,020 0

小米开源模型首日登顶全球榜首，百万亿Token免费送

4月28日凌晨，小米技术官方宣布旗舰大模型MiMo-V2.5-Pro及全模态模型MiMo-V2.5正式全球开源。该系列模型权重已全量开放于Hugging Face等平台，采用宽松的MIT协议，允许全球开发者自由商用、微调及二次训练，无需额外授权。与此同时，小米推出MiMo Orbit计划，宣布于30天内面向全球开发者发放总计100万亿免费Token权益，并与OpenCode、Hermes Age

2026-04-29 大模型 MoE架构智能体 437 0

Meta收购Manus黄了！国家发改委：撤销交易

4月27日，据国家发改委网站消息，外商投资安全审查工作机制办公室（国家发展改革委）依法依规对外资收购Manus项目作出禁止投资决定，要求当事人撤销该收购交易。这意味着，美国科技巨头Meta对中国AI智能体企业Manus的收购计划正式被监管部门叫停。交易回溯：从"嫁入Meta"到被禁 Manus是全球首款通用人工智能体（AI Agent），由 Monica.im 团队开发，于2025年初发布后

2026-04-28 AI智能体外商投资安全审查跨境并购 196 0

马斯克旗下SpaceX或600亿美元收购Cursor，强化AI编程工具

4月22日消息，埃隆·马斯克旗下的太空探索技术公司SpaceX正式对外宣布，已与人工智能编程初创公司Cursor达成一项极具战略意义的协议。根据协议，SpaceX获得了在今年晚些时候以600亿美元（约合人民币4098亿元）价格收购Cursor的权利，或者以100亿美元收购双方正在合作的项目。 SpaceX在X平台上发布的声明中，详细阐述了这一非同寻常的合作架构。声明指出：“SpaceX AI和Cu

2026-04-26 AI编程算力 H100芯片 153 0

Xiaomi MiMo-V2.5 系列大模型开启公测

今天，Xiaomi MiMo-V2.5 系列模型正式开启公测。 Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR。更强的推理，更稳的 Agent ，更长的上下文，更强的指令遵循与模糊指令理解，更好的全模态感知和理解 ——这是一次从“能用”到“好用”的全面跨越。与此同时，我们也对 Token Plan 定价方案

2026-04-23 大模型智能体多模态 211 0

Xiaomi MiMo-V2.5 系列大模型开启公测

2026-04-23 MiMo-V2.5 大模型智能体 730 0

DeepSeek“罕见动作”：计划以100亿美元以上估值，融资3亿美元

据外媒The Information援引多位知情人士透露，中国大模型领域的“技术黑马”DeepSeek（深度求索）正启动成立以来的首次外部股权融资。这家曾长期坚持“自我供血”、多次婉拒资本橄榄枝的企业，计划以不低于100亿美元的估值，募集至少3亿美元资金。这或标志着DeepSeek正式告别由母公司幻方量化独家输血，转而拥抱资本市场，加入全球AI巨头的资本军备赛。截至发稿，DeepSeek方面尚

2026-04-21 DeepSeek 大模型融资 155 0

Token出海，华为云MaaS面向海外9国提供服务

4月10日，华为云MaaS模型即服务在海外正式发布，为新加坡、泰国、印尼、巴西、墨西哥、沙特、阿联酋、南非、土耳其9国用户提供高可靠、低时延的优质Tokens服务。本次上线的模型包含DeepSeek V3.2、Qwen3-32B、智谱GLM-5等多款主流开源模型。卓越性能，重塑生产力开放的模型生态策略：华为云积极引入中国开源SOTA大模型，本次上线的模型包含智谱GLM-5/DeepSeek V

2026-04-16 华为云 MaaS 大模型 Tokens 179 0

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

近日，在中国人工智能产业发展联盟（AIIA）第十七次全体会议上，中国人工智能产业发展联盟、中国信息通信研究院联合华为及工信部人工智能关键技术和应用评测实验室等50余家企事业单位，共同发布《大模型推理优化关键技术及应用实践研究报告》。该报告总结了大模型推理的主要挑战、优化技术、落地成效与最佳实践，旨在为企业构建高质量大模型推理基础设施提供权威的标准建设指导。《大模型推理优化关键技术及应用实践研究

2026-04-16 大模型推理优化 AI 存储 211 0

谷歌论文搅动万亿市场，存储芯片突发暴跌！

一篇论文搅动万亿市场，存储芯片的天塌了... 谁也未曾料到，本周三美股开盘，存储芯片板块遭遇「黑色时刻」，巨头股价全线飘绿—— 截至收盘，美光科技下跌4%，西部数据下跌4.4%，希捷下跌5.6%，闪迪更是重挫6.5%。引发这场抛售地震的导火索，正是谷歌发布的TurboQuant压缩算法。众所周知，大模型跑起来时，KV缓存（KV cache）简直是内存界的「吞金兽」。为了不重复计算之前的To

2026-04-13 TurboQuant KV 缓存存储芯片 204 0

1 雷军强烈建议大家现在就换手机 2 什么是Teflon（特氟龙）？ 3 5亿视频炼出全球最大 GUI 开源数据集、推理 Token 省71%小模型反超大模型——小米 AI 团队多篇论文入选 ICML 2026 4 晶体管转移特性曲线详解：核心参数及应用 5 重磅｜华为发布源网荷储AIDC战略，引领产业未来 6 ISE14.7兼容性问题集锦 7 智慧芯片的主力军，紫光展锐发布UniClaw智能体 8 一块 ESP32，能被 Claude 开发者玩出什么花样？

「大模型」是纳米网电子工程技术社区的热门标签，涵盖相关的技术文章、设计方案和工程师讨论。目前已收录 12 篇优质内容，持续为电子工程师提供专业参考。