临港智算谷
中国经济导报、中国发展网讯 记者缪晓琴上海报道 作为集信息计算力、网络运载力、数据存储力于一体的新型生产力,算力主要通过算力基础设施向社会提供服务。站在日新月异的科技浪潮前沿,当前,上海临港片区的中国电信“临港智算谷”(以下简称“智算谷”),正以破竹之势高效驰骋,为各类科技创新应用输送源源动力。
作为临港新区数字化转型的“桥头堡”,临港智算谷不仅肩负着推动科技创新和产业升级的重任,更承载着构建可持续发展社会的愿景。“起跑”不到一年时间,临港智算谷已为中国电信千亿参数“星辰”大模型产品的运行奠定了坚实基础。2023年,星辰政务大模型率先在上海12345市民热线实现应用落地,将为智慧城市、医疗、自动驾驶、金融等领域添光增彩。
步入智算谷机房,映入眼帘的是井然有序的上千台服务器,整齐排列犹如科技矩阵,在风冷与液冷技术的双重守护下高效运行。一尘不染的机房内,风冷和液冷两套系统同时运转,将万卡算力池运行所散发出的热量转移至另外一个空间,柜机上仪表盘显示的数字表明机房正处于20摄氏度左右的标准温度值区间。
“全国首个国产液冷万卡集群就在我们眼前,目前在运行的已有6000卡,预计今年底前将实现万卡。”临港算力(上海)科技有限公司市场部经理曹春介绍,智算谷创新性的“魔方”式布局实现了单体超万卡的集群能力。
上下层叠,左右延伸,核心交换机在中间楼层。“魔方”巧妙地采用三层立体布局,如同魔都繁华地段的高架桥,似经络般贯穿城市肌理。临港智算谷既满足了人工智能大模型训练高速网络和算力需求,又保障超大集群内部的高带宽、低延迟、零丢包需求,为推动人工智能研究与应用的边界拓展提供了强大的基础设施支持。
spine网络层的近距离全链接,巧妙绕过了ib网络50米传输的局限。每层楼单独能承载10000张算力卡,为万卡级别的超级集群开辟了新天地。追求速度的ib网络时延不到1微秒,兼顾效率与稳定的roce无损以太网也跑到了10微秒,真正实现数据交流的“零等待”,为高性能计算和人工智能的飞速发展铺设了坚实的数字跑道。
随着gpu算力不断攀升,对智算中心的供电、散热等基础条件提出了更高挑战。中国电信领先一步,采用创新的弹性模块化设计方案,让先进的风冷与高效的液冷机柜能在同一机房和谐共存。这种设计不仅高效还节能环保,为数字世界的绿色发展树立了新标杆。
2023年9月,智算谷正式启动,打造了中国电信“两弹一优”高标准aidc示范基地,即弹性供电、弹性供冷与优化气流组织。2024年1月,上海电信重磅发布了全国首个单体万卡液冷智算集群,作为长三角最大规模的运营商级算力资源,实现了单体超万卡的极致集群能力,支持万亿参数大模型训练。
同时,临港智算中心正积极探索绿电应用,与多方合作引入光伏等可再生能源。通过虚拟电厂等创新模式,提高能源使用效率,并有望参与电力市场交易,特别是在用电高峰期减轻社会能源负担。
今后上海电信将以点带面,充分发挥“灯塔效应”,以公共普惠的算力、创新领先的算网服务,进一步加速人工智能技术的研发和应用,满足各类人工智能企业的效率需求,为厚植全市人工智能产业生态作出更大贡献。