标签专题 · 共 2 篇文章

# 推理优化

关于「推理优化」的技术文章、设计资料与工程师讨论,持续更新。

2
篇文章
7
人关注
133
次浏览
OpenAI 全新 GPT-5.5 依托 NVIDIA 基础设施驱动 Codex——NVIDIA 已率先将其投入实际应用

OpenAI 全新 GPT-5.5 依托 NVIDIA 基础设施驱动 Codex——NVIDIA 已率先将其投入实际应用

超 1 万名来自不同职能部门的 NVIDIA 员工提前体验了 OpenAI 全新前沿模型。一位工程师表示,其结果“令人惊叹”。 AI 智能体已经彻底改变了开发者的工作流,而它们迎来的下一个前沿领域是知识型工作:处理信息、解决复杂问题、提出新想法和推动创新。 OpenAI 的代理式编码应用 Codex 正在推动这一全新前沿领域的发展。该应用现在由 OpenAI 最新的前沿模型 GPT-5.5 提供

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

华为联合中国信通院发布《大模型推理优化关键技术及应用实践研究报告》

近日,在中国人工智能产业发展联盟(AIIA)第十七次全体会议上,中国人工智能产业发展联盟、中国信息通信研究院联合华为及工信部人工智能关键技术和应用评测实验室等50余家企事业单位,共同发布《大模型推理优化关键技术及应用实践研究报告》。该报告总结了大模型推理的主要挑战、优化技术、落地成效与最佳实践,旨在为企业构建高质量大模型推理基础设施提供权威的标准建设指导。 《大模型推理优化关键技术及应用实践研究