标签专题 · 共 9 篇文章

# 大模型

关于「大模型」的技术文章、设计资料与工程师讨论,持续更新。

9
篇文章
28
人关注
462
次浏览
小米开源模型首日登顶全球榜首,百万亿Token免费送

小米开源模型首日登顶全球榜首,百万亿Token免费送

4月28日凌晨,小米技术官方宣布旗舰大模型MiMo-V2.5-Pro及全模态模型MiMo-V2.5正式全球开源。 该系列模型权重已全量开放于Hugging Face等平台,采用宽松的MIT协议,允许全球开发者自由商用、微调及二次训练,无需额外授权。与此同时,小米推出MiMo Orbit计划,宣布于30天内面向全球开发者发放总计100万亿免费Token权益,并与OpenCode、Hermes Age

Meta收购Manus黄了!国家发改委:撤销交易

Meta收购Manus黄了!国家发改委:撤销交易

4月27日,据国家发改委网站消息,外商投资安全审查工作机制办公室(国家发展改革委)依法依规对外资收购Manus项目作出禁止投资决定,要求当事人撤销该收购交易。 这意味着,美国科技巨头Meta对中国AI智能体企业Manus的收购计划正式被监管部门叫停。 交易回溯:从"嫁入Meta"到被禁 Manus是全球首款通用人工智能体(AI Agent),由 Monica.im 团队开发,于2025年初发布后

马斯克旗下SpaceX或600亿美元收购Cursor,强化AI编程工具

4月22日消息,埃隆·马斯克旗下的太空探索技术公司SpaceX正式对外宣布,已与人工智能编程初创公司Cursor达成一项极具战略意义的协议。根据协议,SpaceX获得了在今年晚些时候以600亿美元(约合人民币4098亿元)价格收购Cursor的权利,或者以100亿美元收购双方正在合作的项目。 SpaceX在X平台上发布的声明中,详细阐述了这一非同寻常的合作架构。声明指出:“SpaceX AI和Cu

Xiaomi MiMo-V2.5 系列大模型开启公测

Xiaomi MiMo-V2.5 系列大模型开启公测

今天,Xiaomi MiMo-V2.5 系列模型正式开启公测。 Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR。 更强的推理,更稳的 Agent ,更长的上下文,更强的指令遵循与模糊指令理解,更好的全模态感知和理解 ——这是一次从“能用”到“好用”的全面跨越。 与此同时,我们也对 Token Plan 定价方案

Xiaomi MiMo-V2.5 系列大模型开启公测

今天,Xiaomi MiMo-V2.5 系列模型正式开启公测。 Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR。 更强的推理,更稳的 Agent ,更长的上下文,更强的指令遵循与模糊指令理解,更好的全模态感知和理解 ——这是一次从“能用”到“好用”的全面跨越。 与此同时,我们也对 Token Plan 定价方案

DeepSeek“罕见动作”:计划以100亿美元以上估值,融资3亿美元

DeepSeek“罕见动作”:计划以100亿美元以上估值,融资3亿美元

据外媒The Information援引多位知情人士透露,中国大模型领域的“技术黑马”DeepSeek(深度求索)正启动成立以来的首次外部股权融资。这家曾长期坚持“自我供血”、多次婉拒资本橄榄枝的企业,计划以不低于100亿美元的估值,募集至少3亿美元资金。 这或标志着DeepSeek正式告别由母公司幻方量化独家输血,转而拥抱资本市场,加入全球AI巨头的资本军备赛。截至发稿,DeepSeek方面尚

Token出海,华为云MaaS面向海外9国提供服务

4月10日,华为云MaaS模型即服务在海外正式发布,为新加坡、泰国、印尼、巴西、墨西哥、沙特、阿联酋、南非、土耳其9国用户提供高可靠、低时延的优质Tokens服务。本次上线的模型包含DeepSeek V3.2、Qwen3-32B、智谱GLM-5等多款主流开源模型。 卓越性能,重塑生产力 开放的模型生态策略:华为云积极引入中国开源SOTA大模型,本次上线的模型包含智谱GLM-5/DeepSeek V

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

近日,在中国人工智能产业发展联盟(AIIA)第十七次全体会议上,中国人工智能产业发展联盟、中国信息通信研究院联合华为及工信部人工智能关键技术和应用评测实验室等50余家企事业单位,共同发布《大模型推理优化关键技术及应用实践研究报告》。该报告总结了大模型推理的主要挑战、优化技术、落地成效与最佳实践,旨在为企业构建高质量大模型推理基础设施提供权威的标准建设指导。 《大模型推理优化关键技术及应用实践研究

谷歌论文搅动万亿市场,存储芯片突发暴跌!

谷歌论文搅动万亿市场,存储芯片突发暴跌!

一篇论文搅动万亿市场,存储芯片的天塌了... 谁也未曾料到,本周三美股开盘,存储芯片板块遭遇「黑色时刻」,巨头股价全线飘绿—— 截至收盘,美光科技下跌4%,西部数据下跌4.4%,希捷下跌5.6%,闪迪更是重挫6.5%。 引发这场抛售地震的导火索,正是谷歌发布的TurboQuant压缩算法。 众所周知,大模型跑起来时,KV缓存(KV cache)简直是内存界的「吞金兽」。 为了不重复计算之前的To