AI 训练与边缘协同数据中心
- 2022-12-30
- 19
- 伊顿UPS电源(上海)有限公司
AI 训练与边缘协同数据中心(3 MW 级,N+1集群 + 双母线联动)
1. 项目背景
某互联网企业建设 AI 训练数据中心,首期 IT 负载 3.2 MW,峰谷差明显且含大量 GPU 服务器。业主诉求:极致可用性 + 灵活扩容 + 园区级能效。同时需要在园区多栋楼宇之间具备“跨楼栋带载”的能力,便于检修与故障隔离。
2. 场景特征
负载动态:AI 训练秒级波动显著,短时过载需求高;
网络与边缘:训练—推理—边缘协同,推理节点分布在楼内边缘机房;
服务等级:关键集群目标接近 Tier III+,需要 2N 配电或 N+1 高级冗余。
3. 供电总体架构
园区侧:两路 10 kV 进线 → 两路低压母线(A/B)→ 各自 UPS 集群;
数据中心楼:楼层通过母线槽下挂列头柜 → 机柜 A/B PDU;
联动:A/B 母线在园区层面具备环网联络,支持“跨楼栋切流”。
4. UPS 集群与并机
集群规模:每路 4×1000 kVA 并机(N+1),满配可到 4 MW;
控制:去中心化 Hot‑Sync 负载均分;
旁路:静态旁路 + 检修环路旁路,任意单台可不停电割接;
短时能力:逆变短时过载 125%/1 min,配合电池进行“秒级削峰”。
5. 电池与后备
化学体系:LFP 柜式电池(512/576 V),簇级 BMS + 柜级 EMS;
后备时间:10–15 min;
策略:对秒级波动,UPS 与电池协同实现“虚拟储能”,减少对上游配变容量的瞬时冲击;
安全:温控、柜内气体探测、分区气体灭火,BMS/EMS 与 DCIM 联动。
6. 能效策略
运行模式:在良网时启用高效模式,波动超阈值自动回到双变换;
泛在计量:UPS、列头柜、PDU、空调、冷却水系统分层计量,AI 模型优化服务器上架与冷却策略;
回馈自检:利用能量回馈装置进行 UPS 在线自测,减少租用负载箱与热量排放。
7. 监控与AIOps
平台:DCIM + 事件中心 + 工单系统一体化;
数据:V/I/P/PF/THD、风扇/电容寿命、温度热点、BMS 全量数据;
智能运维:预测性维护(寿命模型)、容量趋势与异常检测;
演练:季度剧本——掉一路母线、发电机黑启动、单台 UPS 退出、跨楼栋整路切换。
8. 实施与施工
物流与吊装:大功率 UPS 分体运输、现场组合,楼板承重与抗震设计;
母线:高强螺栓扭矩记录、热像测温验收;
电缆:A/B 分色与桥架隔离,末端选择性保护校核;
调试:功能/并机/旁路/故障注入/黑启动全链路,形成记录与录像档案。
9. 成效与指标
可用性:年度 SLA 达到 99.999%,支持不停电维护与跨楼栋割接;
PUE:首年实测 1.41(对比传统集群方案下降 0.06);
扩容周期:UPS 模块与电池并行加装,扩容周期缩短 30%;
成本:以园区电价测算,年节省电费与制冷费合计约 6.5%(与同规模传统方案对比)。
10. 经验与复用
对 AI 训练波动,采用“UPS + 电池”的秒级调节,可在不增加配变容量的情况下平滑负荷;
园区层面的双母线环网与联络点设计,显著提升检修弹性;
泛在计量+模型驱动的上架策略,对能效与容量边界管理效果显著。
- 上一篇:华东区域金融云数据中心
- 下一篇:没有了!










网站首页
产品中心
新闻资讯
一键拨打