800V:驱动超大规模数据中心的未来

来源:亚德诺半导体 电源管理 16 次阅读
摘要:关键要点 AI工作负载需求急剧攀升,单机柜功耗从120kW跃升至600kW-1MW,向800V架构转型势在必行,以此突破传统48V系统的物理极限。 得益于成熟的生态系统、可靠的工程验证、可控的安全特性以及对现有基础设施的兼容性,48V架构依旧具备高度适用性。 热插拔控制器正转型升级为供电入口节点与首道防线,可提供实时遥测数据、支持预测性维护、优化容量规划,同时提升能耗预测精度并实现主动

关键要点

  • AI工作负载需求急剧攀升,单机柜功耗从120kW跃升至600kW-1MW,向800V架构转型势在必行,以此突破传统48V系统的物理极限。

  • 得益于成熟的生态系统、可靠的工程验证、可控的安全特性以及对现有基础设施的兼容性,48V架构依旧具备高度适用性。

  • 热插拔控制器正转型升级为供电入口节点与首道防线,可提供实时遥测数据、支持预测性维护、优化容量规划,同时提升能耗预测精度并实现主动式故障预防。

超大规模AI工作负载正在重塑数据中心设计规则。为在每个服务器机柜中集成更多GPU,算力密度一路飙升。两年前功耗仅为120kW 的机柜,很快将需要600kW供电。据预测,到 2030年,高端机柜的功耗将达到1MW。

在这样的功率等级下,传统48V架构将触及物理极限,线缆体积过于庞大,电流浪涌亦会导致能效大幅下降。迁移至800V架构可降低电流、减少损耗,并支持采用侧挂式供电单元,从而腾出机柜空间,用于部署更多主机柜计算托盘。这一架构转型,对于超大规模运营商规模化部署先进AI训练与推理至关重要:训练环节依托海量数据集来构建AI模型,推理环节则运用这些模型来输出实时分析与结果。

48V为何仍举足轻重

尽管面向超高功率AI机柜的±400V/800V架构陆续登场,但未来五年以上,48V背板配电方案凭借成熟完善的生态系统、可控的安全特性、易于改造升级的兼容性以及与大量服务器及加速器功率范围的高度契合,仍将占据一席之地。

48V技术现已实现标准化、认证体系成熟,并已大规模落地部署(包括OCP ORv3、超大规模运营商定制机柜等)。现有生态系统根基深厚,超大规模运营商尤为看重久经考验的可靠性与供应链韧性,尤其在整机柜规模化部署场景中。

ADI公司将持续服务两类客户:一类是依托成熟48V基础设施追求高性价比的客户,另一类则是需要800V架构的超大规模数据中心客户。

800V:构筑AI未来的基石

向800V架构迁移绝非简单的渐进式升级,而是对数据中心供电生态系统的根本性重构。提升电压可大幅降低输送同等功率所需的电流。这一看似寻常的技术变革,实则蕴含着深远的战略价值。

释放可扩展性:800V架构可实现单机柜兆瓦级电力输送,打破当前制约算力密度的物理壁垒。由此可在单机柜内部署性能更高的GPU、速度更快的互联链路,打造算力更强的AI集群。

推动能效提升:在同等功率下,更高电压(800V直流)配电可有效降低电流,显著削减输电线路中的阻性损耗,实现更小的电缆尺寸、更高的功率密度和更低的配电热负荷。若再结合精简的电源转换层级与原生直流架构,800V架构可进一步减少高功率AI数据中心的基础设施损耗、耗材用量,并降低总拥有成本。

赋能架构创新:

800V架构支持分离式供电架构,可将配电单元、备用电池组等体积庞大的组件,从IT主机柜迁移至侧机中。由此可以腾出宝贵的机柜空间,用于部署更多计算托盘。

image.png

向800V转型主要是为了满足更高功率供电与更高机柜密度的需求。随着系统规模不断扩大,高压架构已成为现实刚需,也对设备保护与电源路径管理提出了严苛要求。在高压环境下,热插拔控制器堪称系统首道防线,在整机柜中承担更具战略意义的核心角色。

面向800V系统的新一代热插拔控制器,集高级保护与数据采集功能于一身,可实时遥测电压、电流、功率及温度等数据。它带来的价值远超常规遥测功能,能够提供行之有效的系统级洞察,为更科学的决策提供有力支撑。

  • 预测并预防故障:通过分析历史功耗数据,可在组件故障引发灾难性停机前防患未然,实现从被动式维护向预测性维护模式的转变。

  • 优化容量规划:实时负载分析功能可精准呈现能源需求状况,实现更精细的机柜级容量规划,杜绝资源配置铺张浪费。它带来的价值远超常规遥测功能,能够提供行之有效的系统级洞察,为更科学的决策提供有力支撑。

  • 改进能源预测:精准的遥测数据可输入复杂模型中进行能源需求预测,助力成本管控。同时支撑采购策略制定与商务谈判,争取更优的合同条款。

高压数据中心要求实现不间断运行,并支撑各类依赖电力的处理系统持续工作,包括率密度(高压控制与保护)、遥测与诊断(保障可靠性)、高级电源监控(用于预测性维护的系统诊断)等。

热插拔:高压系统的幕后核心技术

随着电压升高,风险亦水涨船高。热插拔技术素来是数据中心可靠运行的中流砥柱,在800V高压环境下更成为关乎任务成败的核心要素,原因如下:

  • 规模化安全保障:在800V高压下带电插拔服务器托盘,容易引发电弧隐患,甚至酿成大祸。热插拔控制器通过管控浪涌电流、隔离故障隐患,有效降低此类风险。

  • 正常运行至关重要:超大规模机柜价值不菲,动辄数百万。停机无异于收入损失。热插拔技术可确保设备在维护期间不间断运转。

  • 智能控制:新一代热插拔解决方案集成遥测功能,支持预测性诊断与实时监控。

ADI在高压热插拔技术创新领域占据优势,提供模块化解决方案,简化系统集成并提升可靠性。此类系统兼具强大的保护功能与新一代高压热插拔控制器,可高效管控浪涌电流。方案还搭载全面的系统诊断遥测功能与先进传感能力,确保在严苛的环境中实现安全、高效的电力传输。通过从系统层面统筹机柜电源发展,开发商能够助力云服务器提供商与系统集成商洞悉先机,实现降本增效。

遥测技术与预测智能

未来的超大规模供电系统将不再只是单纯完成开关动作,更能提供深度洞察。热插拔模块内嵌的遥测功能可实现:

  • 故障预测:提前检测异常状况,以免影响业务运行。

  • 容量规划:优化机柜利用率与能源分配效率。

  • 能源预测:提升可持续性与成本效益。

预测能力可将供电模块从被动部件,转变为保障系统正常运行与性能的主动贡献者。热插拔技术结合先进的监控与保护方案,将成为这场变革的核心。ADI致力于持续推动此类创新,确保数据中心保持高可靠性、可扩展性,并面向未来做好充分准备。

image.png

未来展望

超大规模数据中心向800V架构迁移,已不是“是否可行”的问题,而是“何时落地”的必然趋势。我们当下在数据中心基础设施领域做出的抉择,将直接决定未来创新发展的上限。率先引领这一转型的企业,将夺得关键竞争优势,比同行更快速、更高效地推进AI布局。

与此同时,在众多应用场景中,48V架构仍将作为核心基石持续发挥作用。因此,同时兼容两种架构,并在供电系统中融入智能化、安全性与模块化设计,是顺应行业演进、把握未来方向的制胜关键。

相关推荐
评论区

登录后即可参与讨论

立即登录