ENGLISH

电子新闻

清华电子・可持续行动|高能效AI系统:可持续的大模型基础设施

发布时间:2026-02-21 点击数:

前 言

全球人工智能蓬勃发展,构建绿色、开放、可持续的基础设施,提升能源利用效率,是“产业、创新和基础设施”这一联合国可持续发展目标的重要一环。在亚太地区,如何整合零散算力,实现高能效、低成本的人工智能服务普惠,是一道亟待科技回应的现实考题。

清华大学电子工程系汪玉教授团队带来了他们的答案——高能效人工智能基础设施解决方案,通过整合利用零散分布的多元算力硬件,结合跨越算法设计、模型压缩、算子优化与架构设计等多层次的软硬件联合优化,从而显著提升算力的综合利用效率与基础设施韧性,有效应对AI计算面临的能效挑战,为可持续的基础设施发展提供了创新的技术路径。

高能效人工智能基础设施解决方案

算力整合:让不同算力用“世界语”跨域协作

在人工智能计算中,应用场景高度多样化,既包含实时响应的推理,也涵盖大规模训练,并延伸至服务机器人、智能车联网等不同任务类型。硬件方案也呈现显著异质性,既有通用性强的CPU,也有擅长大规模并行的GPU,还有可编程、能效优于前两者的FPGA,以及针对特定算法定制的ASIC等,这些设备在类型、性能与部署位置上往往差异巨大。

为应对AI算力需求快速增长与硬件供给之间的差距,汪玉教授团队提出,可打造一套能够整合不同地区异构硬件方案,支持应用到硬件自动路由,将N种应用框架映射到M种硬件平台上,根据不同的应用场景需求自动路由到最合适的硬件。同时,也整合不同种类和地区的算力,充分支持人工智能场景应用。

2024年,研究团队在“HETHUB”(一个用于大规模模型的异构分布式混合训练系统)工作中突破性地实现了六种不同品牌芯片间的交叉混合训练。通过将华为昇腾、天数智芯、沐曦、摩尔线程四种国产芯片分别与超威半导体(AMD)、英伟达(NVIDIA)芯片进行联合训练,实现的算力利用率最高可达同构训练的97.6%,支持700亿参数规模的大模型训练。

这一工作被评论为相当于异构芯片间的“世界语”,像翻译官精通多国语言一般,让不同架构的芯片理解彼此的输出与需求。在实际训练中,该系统还能预判每种芯片处理特定任务的速度与效果,实现“因卡制宜”的智能任务分配,提升整体算力利用率。

在此基础上,团队进一步通过并行编排机制的创新,在通信带宽不足1GB/s的条件下,实现跨越2000公里的机房集群间联合训练。由此,中小企业可利用极少量边缘算力与充沛云端算力协同运行人工智能,让高价值数据资产得以留在本地,极大释放人工智能行业的数据价值。

方案支持远距离异构算力协作

软硬协同:让AI计算“花小力气办大事”

亚太地区清洁能源资源丰富,海上风电与水电潜力巨大,同时也是全球海缆网络的枢纽。经济增长带来AI应用场景的爆发,也激化着电力短缺与智算中心匮乏的矛盾。

如何让人工智能计算在质量不变的前提下,消耗更少的能源?汪玉教授团队的解决方案则是通过精细化的软硬件协同,结合跨越算法设计、模型压缩、算子优化与架构设计等多层次的优化技术,提升每个节点的能效,从而实现更加高效和可持续的计算。在应用算力方面,团队已通过稀疏计算软硬件联合设计,在不牺牲模型效果的前提下,将文生文应用算力提升了13倍、能耗降低了600%,文生图算力提升了27倍、能耗降低了400%。

团队相关工作曾连续被2024、2025年国际可重构计算领域顶级会议 FPGA 录取,其中2025年的工作视频生成大模型推理IP “FlightVGM”,首次在可重构逻辑集成电路上实现了视频生成模型的高效推理,以“全华班”阵容获得 FPGA 会议最佳论文奖。

据《中国科学报》报道,这不仅是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,也是亚太地区首次由单一国家团队获得该会议最佳论文奖。

方案持续提升人工智能计算能效

这样一个高能效的AI系统,不再简单追求“每焦耳能量支持的计算次数”,而是优化“每焦耳能量处理的有效Token数量(Tokens/J)”,正是智能时代更绿色、更可持续的基础设施能效指标。

降本普惠:让不发达地区也用得起AI服务

AI服务的成本问题,一直是制约技术普惠的关键障碍,在许多发展中地区,昂贵的算力成本使当地企业与机构望而却步。研究团队及相关科技成果转化企业无问芯穹的产业目标是让AI成本实现3~4个数量级的下降--这不是简单的价格削减,而是通过基础设施的系统性优化降本增效、提升从能源到智能服务转化的效率及稳定性。

目前,企业团队构建的基础设施系统已在中国多个地区验证了其可行性,并在上海徐汇模速空间算力生态平台、北京海淀公共算力服务平台、浙江杭州算力资源服务平台、上海静安AI+大视听公共服务平台等项目中相继落地,形成了可复制的基础设施服务模式,服务能力覆盖了近千家科研机构与人工智能企业。

方案已转化服务多地公共服务平台

这些平台的共同特点是将算力服务从单一资源交易升级为全产业链生态引擎。中小企业不再需要自行购买昂贵的计算硬件,而是根据实际需求获取人工智能服务;不同优先级的任务可分配至不同成本的计算;训练与推理任务可根据时效性要求灵活调度。当人们每次和人工智能交互的成本从几元人民币降至几乎可以忽略不计,许多原本“不可行”将变得可行,这正是成本下降带来的普惠价值。

对于经济发展薄弱地区,这种模式提供了可借鉴的路径,无需总是投入巨资建设大型数据中心,而是通过这样一套分布式基础设施连接区域内能源、资源富集区,逐步构建符合本地需求的数字服务体系。

从清华走向世界:科技的普惠力量

从实验室的算法到产业的解决方案,这套成果走出了校园,走进了越来越多的产业场景中。它展示的不仅是一项技术创新,更是一种发展理念:通过先进技术与产业模式的高质量结合,让最需要的地方以可承受的成本获得最先进的人工智能服务。该方案将向世界展示科技如何传递温度,助力全球实现“产业、创新和基础设施”可持续发展的美好愿景。我们期待,随着高能效人工智能系统技术的日益普及,亚太地区人工智能基础设施建设也将朝着更加均衡、绿色、普惠的数智化未来迈进。

近年来,清华大学电子工程系与联合国相关机构持续开展深入交流,共同探索前沿科技赋能可持续发展目标的路径。2024年10月,来自国际电信联盟、世界卫生组织等五家国际组织的代表访问电子系,师生们展示了人工智能与大数据平台在城市规划、智慧交通、个性化健康等领域的创新应用。2025年10月,联合国亚太经济社会委员会执行秘书阿里沙赫巴纳一行到访清华电子系,现场观摩了人形机器人、仿生人脸及城市模拟器等成果,深入了解电子系如何从现实需求出发,将人工智能技术转化为服务社会的实际方案。

2026年2月24日至27日,清华大学将受邀参加在泰国曼谷举行的第十三届联合国亚太可持续发展论坛(APFSD),在国际舞台进一步分享以科技推动可持续发展的清华方案。

供稿|电子系机关办公室

排版|陶旋姿

审核|余潇潇 沈 渊 李冬梅

分享到: