算力是技术发展、城市运转的重要保障,而其本身也正是创新迭代的重要对象。澎湃研究所研究员认为,当下正应关注数据中心——尤其是AI数据中心,如何实现低碳绿色发展。
算力的迭代正在发生。要进行模拟现实的数值计算——比如进行天气预报等,作为普惠型城市公共算力服务平台,上海超算中心经过算力提升已能满足需求。但到了AIGC时代,其算法基于图像识别,需要处理单指令多数据,对应着大量并行计算。此前基于摩尔定律的总线处理方法已不敷使用。AI超算形成了一套行业标准。大模型的训练皆需借助能提供这类服务的数据中心进行,大多称作“智算中心”。
世界上能被计算处理的复杂系统越来越多,但可供人类利用的能源当下仍然有限。如何看待算力与能耗这对矛盾?又如何让城市在这轮AI技术转型中长久受益?通过走访上海等地各类数据中心,并与相应技术专家、上下游产业人士深入交流,澎湃研究所研究员在此分享一些观察和思考。
国家政策层面早已关注到算力的高质量发展。2021年,工业和信息化部发布等,引导算力基础设施向高效协同、绿色智能方向发展星空体app首页。XK星空体育2023年10月,工业和信息化部等六部门联合印发《算力基础设施高质量发展行动计划》(下称“行动计划”),提出到2025年的六点任务,包括完善算力综合供给体系、提升算力高效运载能力、强化存力高效灵活保障、深化算力赋能行业应用、促进绿色低碳算力发展、加强安全保障能力建设等。
正如人体单位体积最耗能的器官是脑,城市中最耗能的正是算力基础设施。近日《返朴》文中说到,典型CPU芯片功率大概是每立方厘米100瓦,即每立方米1亿瓦;而太阳核心的功率每立方米不到300瓦。OpenAI训练大语言模型GPT-4时,完成一次训练需要约三个月,使用大约25000块英伟达A100 GPU。每块A100 GPU拥有540亿个晶体管,功耗400瓦,每秒可进行19.5万亿次单精度浮点数的运算,每次运算涉及多个晶体管的开关。这些 GPU一次训练就用了2.4亿度电。
关于算力网络和大模型的一切才刚开始。在中国,当下相应设施尚有缺口,需求则呈爆发式增长。从城市到相关政府部门,也在尽力统筹调度算力资源,构建自主可控的算力网络建设。为支持国内的大模型算力发展,贵州南京上海北京等地,均出台了算力券措施。
不过,当下大模型应用极易陷入同质化。市场在经历优胜劣汰、达成均衡之前,关键性的比拼会发生在算力方面。近日市场人士提到,这波大模型浪潮中,约近半资金用来购买算力,而不是用在人力上。大概是能用AI完成的工作,已无需依靠程序员。
以目前的技术水平,能源会是制约算力发展的瓶颈。当下电费约占数据中心运营成本的70%。通过市场龙头企业发布的信息可知,全球芯片技术的升级,每两年可让每次计算的能耗降低40%,但模型计算量每年大约以十倍速度增长。美国能源部长近日也表示,为缓解AI数据中心的用电需求,正探索核电站解决方案。
近年来,中国也在针对此类问题求解。2021年启动的“东数西算”,可谓宏观层面的战略。2023年底,国家发展改革委、国家数据局、中央网信办、工业和信息化部、国家能源局发布《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》(下称“实施意见”)提出,到2025年底,算力电力双向协同机制初步形成,国家枢纽节点新建数据中心绿电占比超过80%。
“东数西算”正在稳步推进。如位于青海海东的中国电信(国家)数字青海绿色大数据中心“100%清洁能源可溯源”,甘肃兰州的甘肃国网云数据中心“运行中100%清洁能源供电”。此类利用当地清洁能源的新建数据中心还有不少,暂不列举。
虽然可以进行算力调度,但由于诸多应用条件限定,一些算力设施仍需临近数据需求方。如何使这类算力设施得到长久的绿色发展?当下中国各类数据中心,大多基于建筑空间选取节能策略,如采用液冷或引入可再生能源等。深圳2023年发布了地方标准《绿色数据中心评价规范》,从能源资源高效利用(44分)、环境影响管理(5分)、基础设施(30分)、运维管理(21分)等方面进行评价。
从已建成运行一段时间的数据中心看,选址在湖畔或寒冷地带,有利于降温及回收热量;又或是运用光伏和储能设施,以降低散热的能耗。最后还可通过采购绿电弥补缺口。
功耗比是硬性指标。2021年工信部发布的《新型数据中心发展三年行动计划》规定:新建大型及以上数据中心的PUE(Power Usage Effectiveness,功耗比)降到1.3以下;严寒和寒冷地区力争降低到1.25以下;可再生能源利用率不断提高。
仅有此项还不够。国际上,结合数据中心的碳足迹与水资源等方面的使用,“xUE”评估指标组合逐渐发展,以PUE、CUE(Carbon Usage Effectiveness,碳利用效率)、WUE(Water Usage Effectiveness,水利用效率)和IUE(Infrastructure Usage Effectiveness,基础设施使用率)用以综合评估算力运营过程中数据中心的可持续发展绩效。中国2023年10月的“行动计划”中,对PUE、CUE、WUE亦有相应体现。
数据中心的绿色,不能仅限于单体设施,需要在全周期的产业链中实现,并起到带动作用。早在2018年到2022年,由工业和信息化部、国家机关事务管理局、国家能源局联合评估,评出了百余家国家绿色数据中心。相应推荐标准提到,需建立并实施绿色采购制度,“协同带动产业链供应链绿色供给能力提升”。到了2023年,“行动计划”进一步对算力设施赋能行业绿色低碳转型提出要求,提出要构建’算力+’绿色低碳生态体系,降低社会碳排放总量。
上述愿景可谓非常清晰。但究竟如何给绿色算力赋能?又如何能够将专业和开放的评估结果,反馈为可持续发展供应链的选择?
从终端看,算力得到的是为人所用的数据,或许要像碳足迹的追溯那样,形成可追溯的链条,尤其是在商用层面。澎湃研究所研究员注意到,4月2日,国家数据局发布了《深化智慧城市发展推进城市全域数字化转型的指导意见(征求意见稿)》,“城市全域数字化转型”已在标题之中。这意味着,必然需要更多开放数据;而与“双碳”目标结合,则对应更深入和更大范围的碳普惠。XK星空体育2023年底“实施意见”的发布方中,便有组建不久的国家数据局。
换言之,数据当下已然具备战略性的价值。从使用能源的算力设施,到运用算力的相关机构,都可以此进行追溯和评估。如果能使这些数据开放,供相应社会机构比对,纳入各种评级或更多应用,可促动更大层面的多元创新。
AI数据中心的绿色低碳发展,也是大势所趋。自2024年5月1日起,A股上市公司披露可持续发展报告需按指引进行。未来,企业以绿色算力、绿色能源为基底,对自身的健康发展,乃至整个经济体的可持续发展,都大有裨益。
在能源这端,微电网、源网荷储等创新试点早已开始。数据中心正是重要的应用。“行动计划”也提到:“推动鼓励龙头企业以绿色化、智能化、定制化等方式高标准建设数据中心,充分利用现有能源资源优势,结合自身应用需求,提供能源流、业务流、数据流一体化算力。”上海等地也已出台了相应探索政策。
对于这一轮产业革命,AI数据中心的用能,XK星空体育正像是个牛鼻子——生产工具和能源形式相辅相成,就像工业革命中的蒸汽机和煤炭。经历过煤炭的污染,人类已然意识到,能源不仅要与生产工具相适应,还要与生存环境的可持续发展相一致。引领性的创新产业集群必然围绕这类硬骨头而来。眼下,探索算力设施可持续信息的披露和应用,正可让我们更好地适应全球的市场与未来的世界。