混合存储架构破解边缘AI片上内存瓶颈

来源:电子工程专辑 制造工艺 30 次阅读
摘要:边缘人工智能(Edge  AI)使自动驾驶汽车、医疗传感器和工业监控器能够从实时接收到的真实世界数据中学习。如今,它已能够即时应用学习模型,同时严格管控能耗与硬件损耗。 这得益于一套混合内存系统,该系统将两种此前互不兼容的技术——铁电电容器和忆阻器——的最佳特性融合到一个与CMOS兼容的单一内存堆栈中。这种新型架构由CEA-Leti的科学家与法国微电子研究中心的研究人员合作开发。 他们的研究成果发

边缘人工智能(Edge  AI)使自动驾驶汽车、医疗传感器和工业监控器能够从实时接收到的真实世界数据中学习。如今,它已能够即时应用学习模型,同时严格管控能耗与硬件损耗。

这得益于一套混合内存系统,该系统将两种此前互不兼容的技术——铁电电容器和忆阻器——的最佳特性融合到一个与CMOS兼容的单一内存堆栈中。这种新型架构由CEA-Leti的科学家与法国微电子研究中心的研究人员合作开发。

他们的研究成果发表在《自然·电子学》杂志上,论文题为“A Ferroelectric-Memristor Memory for Both Training  and  Inference”(用于训练和推理的铁电-忆阻器内存)。论文阐述了如何以极具竞争力的精度在芯片上进行训练,从而避免了片外更新和复杂的外部系统依赖。

片上内存难题

边缘AI既需要推理(用于读取数据以做出决策),也需要学习(即训练,用于在芯片上根据新数据更新模型),同时还要避免耗尽能耗或对硬件造成过大负担。然而,对于片上内存而言,忆阻器虽然被认为适用于推理任务,但铁电电容器(FeCAP)则更适合学习任务。

电阻式随机存取内存(即忆阻器)在推理方面表现出色,因为它们可以存储模拟权重。此外,它们在读取操作期间能耗低,并且更适合存内计算。然而,忆阻器的模拟精度虽然足以满足推理需求,但对于需要小幅、渐进式权重调整的学习任务而言却显不足。

另一方面,铁电电容器可以实现快速、低功耗的更新,但它们的读取操作会破坏数据,因此不适合用于推理。因此,设计工程师面临着两难选择:要么优先考虑推理并将训练外包给云端,要么承受高成本和有限持久性来进行片上训练。

这促使法国科学家采用了一种混合方法:前向传播和后向传播使用以模拟形式存储在忆阻器中的低精度权重,而权重更新则使用更高精度的铁电电容器。“忆阻器会根据存储在FeCAP中的最高有效位进行周期性重编程,从而确保高效、精确的学习。”该新型混合内存系统论文的第一作者Michele  Martemucci表示。

混合方法的工作原理

CEA-Leti团队通过设计一种由掺硅氧化铪和钛清除层构成的统一内存堆栈,开发了这种混合内存系统。这种双模内存器件可以根据其电学状态,作为FeCAP或忆阻器运行。

换句话说,同一个内存单元可以根据其状态,分别用于精确的数字权重存储(训练)和模拟权重表达(推理)。在此过程中,一种无需专用数模转换器(DAC)的方法,将FeCAP中的隐藏权重转换为忆阻器中的电导水平。

该混合内存系统的硬件采用标准的130纳米CMOS工艺制造,并在包含18,432个器件的阵列上进行了测试,成功将两种类型的内存及其外围电路集成在单个芯片上。

该研究获得了欧洲研究理事会和法国政府“法国2030”计划的资助。

相关推荐
评论区

登录后即可参与讨论

立即登录