标签专题 · 共 15 篇文章

# 大模型

关于「大模型」的技术文章、设计资料与工程师讨论,持续更新。

15
篇文章
46
人关注
744
次浏览
谷歌阿里争锋,华为掉队,百度抢位

谷歌阿里争锋,华为掉队,百度抢位

AI全栈,一定是少数者的游戏。 AI即将迎来它的“寡头时代”。 执掌阿里的吴泳铭明确表示:阿里全栈AI技术投入已正式跨越初期培育阶段,进入正向的规模商业化回报周期。 意思是,AI能帮阿里赚钱了。 但帮其赚钱的不仅仅是千问、也不仅仅是阿里云,而是凭借“自研平头哥芯片+千问大模型+阿里云+应用生态”形成的全栈AI能力。 而目前像阿里一样依靠AI全栈能力“稳坐中军帐”的厂商,全球只有大洋彼岸的谷歌。当A

豆包收费上热搜!免费午餐到头了?

豆包收费上热搜!免费午餐到头了?

5月4日,坐拥3.45亿月度活跃用户的AI应用豆包,在App Store更新付费订阅声明的消息登上微博热搜。根据声明,豆包将推出三档付费会员:标准版连续包月68元、加强版200元、专业版500元,年费分别为688元、2048元和5088元。豆包官方随后回应称,基础版完全免费,日常聊天、文案撰写、信息查询等核心功能不受影响,付费功能主要聚焦PPT生成、数据分析、影视制作等复杂任务和生产力场景,相关方

前Qwen负责人林俊旸创业,目标融资规模为数亿美元

据The Information报道,前阿里通义千问Qwen核心负责人林俊旸正在为其新成立的AI实验室寻求融资,目标融资规模为数亿美元。 高榕资本和红杉中国正在洽谈参与本轮融资,如果交易完成,这家尚处早期的新AI实验室估值可能达到约20亿美元。不过相关谈判仍在进行中,最终融资金额和估值仍可能发生变化。 有分析认为,此次林俊旸开启自主创业,在无营收、无产品的情况下,纯靠团队和创业方向便被估值百亿元,

老外魔改DeepSeek,杀入全球第一!

老外魔改DeepSeek,杀入全球第一!

最近几天,一个叫 DeepSeek-TUI 的开源项目突然在 GitHub 彻底火了,仅仅在过去一天,Star 数量直接从 8.7k 又涨到了 16.3k。 DeepSeek-TUI 不是 DeepSeek 官方产品,而是个人开发者基于 DeepSeek V4 开发的终端原生编程智能体。但它涨星的速度很快,吸引了国内外很多 AI 开发者的关注,短短几天时间就冲上了 GitHub Trending

小米开源模型首日登顶全球榜首,百万亿Token免费送

小米开源模型首日登顶全球榜首,百万亿Token免费送

4月28日凌晨,小米技术官方宣布旗舰大模型MiMo-V2.5-Pro及全模态模型MiMo-V2.5正式全球开源。 该系列模型权重已全量开放于Hugging Face等平台,采用宽松的MIT协议,允许全球开发者自由商用、微调及二次训练,无需额外授权。与此同时,小米推出MiMo Orbit计划,宣布于30天内面向全球开发者发放总计100万亿免费Token权益,并与OpenCode、Hermes Age

Meta收购Manus黄了!国家发改委:撤销交易

Meta收购Manus黄了!国家发改委:撤销交易

4月27日,据国家发改委网站消息,外商投资安全审查工作机制办公室(国家发展改革委)依法依规对外资收购Manus项目作出禁止投资决定,要求当事人撤销该收购交易。 这意味着,美国科技巨头Meta对中国AI智能体企业Manus的收购计划正式被监管部门叫停。 交易回溯:从"嫁入Meta"到被禁 Manus是全球首款通用人工智能体(AI Agent),由 Monica.im 团队开发,于2025年初发布后

马斯克旗下SpaceX或600亿美元收购Cursor,强化AI编程工具

4月22日消息,埃隆·马斯克旗下的太空探索技术公司SpaceX正式对外宣布,已与人工智能编程初创公司Cursor达成一项极具战略意义的协议。根据协议,SpaceX获得了在今年晚些时候以600亿美元(约合人民币4098亿元)价格收购Cursor的权利,或者以100亿美元收购双方正在合作的项目。 SpaceX在X平台上发布的声明中,详细阐述了这一非同寻常的合作架构。声明指出:“SpaceX AI和Cu

Xiaomi MiMo-V2.5 系列大模型开启公测

Xiaomi MiMo-V2.5 系列大模型开启公测

今天,Xiaomi MiMo-V2.5 系列模型正式开启公测。 Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR。 更强的推理,更稳的 Agent ,更长的上下文,更强的指令遵循与模糊指令理解,更好的全模态感知和理解 ——这是一次从“能用”到“好用”的全面跨越。 与此同时,我们也对 Token Plan 定价方案

Xiaomi MiMo-V2.5 系列大模型开启公测

今天,Xiaomi MiMo-V2.5 系列模型正式开启公测。 Xiaomi MiMo-V2.5 系列包含 MiMo-V2.5、V2.5-Pro 、V2.5-TTS Series 、V2.5-ASR。 更强的推理,更稳的 Agent ,更长的上下文,更强的指令遵循与模糊指令理解,更好的全模态感知和理解 ——这是一次从“能用”到“好用”的全面跨越。 与此同时,我们也对 Token Plan 定价方案

DeepSeek“罕见动作”:计划以100亿美元以上估值,融资3亿美元

DeepSeek“罕见动作”:计划以100亿美元以上估值,融资3亿美元

据外媒The Information援引多位知情人士透露,中国大模型领域的“技术黑马”DeepSeek(深度求索)正启动成立以来的首次外部股权融资。这家曾长期坚持“自我供血”、多次婉拒资本橄榄枝的企业,计划以不低于100亿美元的估值,募集至少3亿美元资金。 这或标志着DeepSeek正式告别由母公司幻方量化独家输血,转而拥抱资本市场,加入全球AI巨头的资本军备赛。截至发稿,DeepSeek方面尚

仰望星空,共赴征程:地平线将发布中国首个舱驾融合智能体芯片方案

仰望星空,共赴征程:地平线将发布中国首个舱驾融合智能体芯片方案

4月11日,智能电动汽车发展高层论坛(2026)在北京召开。地平线创始人兼CEO余凯以“仰望星空,共赴征程:奔向物理世界AI的伟大时代”为主题发表演讲,在回顾品牌2025年的发展成果的同时,抛出重磅消息:地平线即将发布舱驾融合智能体芯片方案——星空系列,推动汽车向智能体演进,依托物理AI时代的核心基础设施,以极致创新推动技术普惠。 向高而行 星空系列将重磅发布 2025年,地平线在智驾赛道上持续

Token出海,华为云MaaS面向海外9国提供服务

4月10日,华为云MaaS模型即服务在海外正式发布,为新加坡、泰国、印尼、巴西、墨西哥、沙特、阿联酋、南非、土耳其9国用户提供高可靠、低时延的优质Tokens服务。本次上线的模型包含DeepSeek V3.2、Qwen3-32B、智谱GLM-5等多款主流开源模型。 卓越性能,重塑生产力 开放的模型生态策略:华为云积极引入中国开源SOTA大模型,本次上线的模型包含智谱GLM-5/DeepSeek V

选择华为云,轻松拥有您的专属病理模型!参与“早鸟”体验赢好礼,瓜分百亿Tokens!

不懂AI算法,没有本地算力,也能训练大模型吗?现在可以。 华为云医疗AI使能平台来了!三步完成诊断,分钟级推理,少量样本即可训练专属模型, AI不再只是工具,而是每位医生会进化的数字分身,让每家医院拥有专属的病理模型,把重复分析交给机器,把时间还给医生。 4月13日,“华为云医疗AI使能平台(智慧病理场景)早鸟体验活动”报名正式开启,平台将面向广大病理医生及病理科相关工作者开放注册试用通道,诚邀您

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

近日,在中国人工智能产业发展联盟(AIIA)第十七次全体会议上,中国人工智能产业发展联盟、中国信息通信研究院联合华为及工信部人工智能关键技术和应用评测实验室等50余家企事业单位,共同发布《大模型推理优化关键技术及应用实践研究报告》。该报告总结了大模型推理的主要挑战、优化技术、落地成效与最佳实践,旨在为企业构建高质量大模型推理基础设施提供权威的标准建设指导。 《大模型推理优化关键技术及应用实践研究

谷歌论文搅动万亿市场,存储芯片突发暴跌!

谷歌论文搅动万亿市场,存储芯片突发暴跌!

一篇论文搅动万亿市场,存储芯片的天塌了... 谁也未曾料到,本周三美股开盘,存储芯片板块遭遇「黑色时刻」,巨头股价全线飘绿—— 截至收盘,美光科技下跌4%,西部数据下跌4.4%,希捷下跌5.6%,闪迪更是重挫6.5%。 引发这场抛售地震的导火索,正是谷歌发布的TurboQuant压缩算法。 众所周知,大模型跑起来时,KV缓存(KV cache)简直是内存界的「吞金兽」。 为了不重复计算之前的To