英特尔的AI战略侧重于运营规模、生命周期管理以及全厂范围的部署。
AI已经融入半导体制造环节,在检测工具、统计过程控制和良率分析等方面提供支持。因此,AI在半导体行业并非从无到有的新生事物,但其角色正在发生变化。随着设备架构日益复杂、制程工艺窗口不断收窄,AI正逐渐成为支撑先进晶圆厂持续运行的核心基础设施的一部分。
在英特尔代工,这一转变在内部被描述为从孤立的分析转向该公司所称的“大规模应用智能”。重点不在于实验性模型,而在于那些贯穿整个制造流程、持续运行的生产系统。
英特尔代工数据分析与人工智能高级总监Rao Desineni表示:“我们在工厂各处都使用人工智能。无论是缺陷检测、排期与调度,还是利用数据找出良率问题的根本原因,我们在每一个环节里都应用了AI技术。”

以端到端视角推动AI部署
英特尔的方法在一定程度上源于其作为集成设备制造商(IDM)的悠久历史。与视角较为聚焦的纯代工厂不同,英特尔对AI的应用覆盖了完整的生产链条,从早期的技术开发到大规模制造、先进封装和最终测试。
Desineni领导着一个约300人的团队,成员包括数据科学家、软件工程师和数据工程师,负责管理半导体制造数据,并在整个工厂网络中构建AI驱动的解决方案。”数据环境的规模正在迅速扩大,我们存储的数据量已经增长至数拍字节”,Desineni表示。
数据的广度使得英特尔能够在晶圆厂的多个环节应用机器学习,诸如自动缺陷分类、预测性良率分析、异常检测和调度优化等领域均在其列。不过,对英特尔来说,技术上更为成熟,经济效益也更大的,是在工艺流程的早期阶段进行故障预测。
英特尔最成熟的AI应用之一是预测性芯片筛选,公司内部将其称为“N−1/N+1”理念。这一理念简单却有效,利用上游数据,预测出哪些芯片可能在下游环节出现故障,从而在耗资巨大的封装工序开始之前及时发现问题。
在现代制造中,晶圆即使通过了电气测试,仍可能包含一些处于即将损坏的芯片,这些芯片在后续受力时会发生故障。Desineni将此类芯片称为“带伤”的部件。随着先进的多芯片封装技术的应用,风险进一步增加,因为其中一块芯片的损坏会导致整个封装报废。
“假设封装中包含10个芯片,一旦其中一个坏了,其余九个也会被丢弃,这就是连带损耗”,Desineni表示。
英特尔的模型通过分析上游工艺数据、晶圆分选结果及历史行为,在可能损坏的芯片进入昂贵的封装流程前将其标记出来。挑战不仅在于预测精度,更在于经济优化。正如Desineni所描述的,这是一个“非常巧妙的约束优化”问题,需要在质量提升与不必要的报废之间取得平衡。

这项技术本身并非新鲜事物,但随着数据量的激增和设备架构日益复杂,其应用规模和集成程度也随之扩大。如果说预测性晶圆筛选展示了这项技术的价值,那么其背后的数据环境则解释了为何在晶圆厂部署AI依然异常困难。
据Desineni介绍,半导体制造产生的数据集极不平衡。现代芯片可能包含数十亿个晶体管,但决定良率的却是其中极少部分的故障。“也许只有不到0.1%的数据是负样本,其余的都是好的”,Desineni表示,并指出可用于训练的故障样本极为稀缺。
这种不平衡给预设训练数据较为平衡的标准机器学习流程带来了挑战。稀疏采样进一步加剧了这一问题。由于测量步骤会占用宝贵的工期,晶圆厂通常只对每批晶圆中的一个子集进行检测。“我们可能只测量25片晶圆中的一片,或者两三片,” Desineni介绍,“同样,这里存在大量缺失数据。”
由此产生的数据环境高度异构,融合了图像、时间序列信号、晶圆图和设备遥测数据。为消费类或金融应用开发的现有AI工具,并不总能直接迁移使用。
为解决新制程工艺节点中的冷启动问题,英特尔还采用了基于条件生成对抗网络等技术的合成数据生成方法。这些方法使工程师能够在已标注的大型数据集存在之前就开始训练模型,随后随着真实生产数据的积累不断优化模型。
从概念验证到生产基础设施
对Desineni而言,在现代晶圆厂部署AI的关键区分之处不在于模型的复杂程度,而在于运营的成熟度。他将实验性项目与他所说的真正的大规模部署严格区分开来:“对我来说,大规模部署意味着它已经超过了概念验证的阶段。”
从实际应用来看,在英特尔部署的大规模AI必须满足若干标准。模型必须基于涵盖边界情况的大规模数据集训练而成,集成到工厂自动化系统中,并能够基于实时生产数据进行推理。同样重要的是,成功的技术必须能在生产相同制程节点的多个晶圆厂中复现。
这一要求带来了企业软件领域常见,但在制造AI中仍在演进的生命周期管理挑战。随着工艺配方调整、新的缺陷模式出现或设备行为漂移,模型性能可能会下降。
在各种应用中的AI模态中,计算机视觉持续产生着最显著的影响。自动缺陷分类在英特尔的生产线上已应用近二十年,但模型和方法仍在不断更新。每周,该公司都会自动对检测设备捕获的数百万张缺陷图像进行分类。Desineni将这一数据流描述为最丰富的制造洞察来源之一。
“我们过去称之为图像分析,如今,它被称为人工智能”,他说。

尽管模型架构取得了进步,但成功与否仍很大程度上取决于领域专业知识和数据准备工作。更优质的图像、更完善的标注以及与工程工作流的更紧密集成,都有助于提升性能。Desineni强调,即使应用了最先进的模型,如果其设计中未融入深厚的工艺知识,也注定会失败。
尽管机器学习日益成熟,半导体制造行业仍对风险持高度规避态度。AI系统通常被部署为决策支持工具,而非完全自主的控制器。“当我通过AI找到答案时,我不会直接实施该建议”,Desineni表示,“我总是让人参与决策。”
这种混合模式既反映了技术现实,也体现了企业对信任的要求。基于概率的AI系统,即便是高精度的系统,也必须与对缺陷的容忍度近乎为零的工艺流程并存。
投资回报率可通过多种方式衡量,包括人力投入的减少、问题排查速度的提升、良率的改进,以及技术学习速度的加快。此外,易用性往往和模型的原始性能同等重要。“大多数用户并不关心AI模型,他们关心的是易用性”, Desineni说道。
随着晶圆厂不断向日益复杂的工艺节点和先进封装方案推进,这种务实的思维方式很可能将延续下去。尽管AI正在半导体制造领域迅速扩展,但就目前而言,其作用依然明确:辅助工程师,减少干扰,帮助工厂比以往更早地发现问题。
评论区
登录后即可参与讨论
立即登录