2025年3月5日,由国际电气电子工程师学会 (IEEE) 主办的第31届高性能计算机体系架构国际研讨会 (HPCA) 在美国拉斯维加斯召开,全球来自计算机体系架构领域的700余位研究者参加此次会议。本次大会共收到来自全球顶尖研究机构和高校的论文投稿534篇,其中113篇被录用,录用率约为21.2%。
清华大学电子系电路与系统研究所汪玉教授、杨华中教授与香港科技大学谢源教授、中科院微电子所李冰副研究员、北京大学孙广宇副教授合作的论文 “UniNDP:面向DRAM近存储计算的统一编译与仿真工具”(UniNDP: A Unified Compilation and Simulation Tool for Near DRAM Processing Architectures)成功入选,该论文的共同第一作者为电子系博士生谢童欣与博士后助理研究员朱振华,通讯作者为汪玉与朱振华。该论文荣获该会议最佳论文荣誉提名奖(Best Paper Honorable Mention)。在113篇投稿中,共有11篇被选为最佳论文候选。组委会从创新性、潜在影响力、工作完整性以及审稿评分等多方面筛选,评选出2篇最佳论文荣誉提名奖与1篇最佳论文奖。

获奖照片

获奖证书
基于DRAM的近存储计算架构可以有效提升访存带宽,高效实现神经网络推理计算。现有近存储计算架构设计差异大,难以以一种统一的方式将机器学习模型高效编译部署至不同的近存计算架构上。针对这一问题,本文提出了基于通用架构与指令集抽象的编译仿真部署工具链。该工具链可以支持神经网络负载在不同种类的近存计算架构上的通用高效编译部署。与现有的数据映射和编译方法相比,可在不同架构上取得至多3.43倍的端到端加速。该工具现已开源:https://github.com/thu-nics/UniNDP。该工作得到了重点研发计划“大规模、高能效的存算一体系统”等项目支持。

UniNDP整体仿真编译流程
HPCA是高性能计算和体系架构领域顶级的国际学术会议,论文评审过程严苛,论文入选标准很高,因此收录的论文也一直具有较高的学术和产业价值。据了解,包括英特尔、英伟达、谷歌、三星、AMD等在内的企业都在该会议上发表过最新的研究成果,引导了行业的发展方向。在该会议入选论文也证明了电子系在高性能计算和芯片领域的创新研究能力。

2025年HPCA会议将于3月1日至3月5日举办
团队介绍
汪玉教授长期从事智能芯片、高能效电路与系统研究,发表IEEE/ACM期刊论文60余篇、会议论文270余篇,谷歌学术引用24,000余次。主持国家级以及企业联合项目多项,获CCF科学技术奖技术发明一等奖、国际设计自动化会议40岁以下创新者奖、CCF青竹奖等荣誉。曾获得5次国际学术会议最佳论文奖及13次最佳论文提名。2016年知识成果转化入股深鉴科技,打造世界一流的深度学习计算平台,2018年被业内龙头企业赛灵思(现AMD)收购。2023年推动成立无问芯穹,形成面向大模型的软硬件联合优化平台,在国内外十余种芯片上实现业界领先的大模型推理性能。
感兴趣的读者可联系:
朱振华 博士后助理研究员
邮箱zhuzhenhua@mail.tsinghua.edu.cn
供稿|电路与系统研究所
编辑|陶旋姿
审核|汪 玉 沈 渊 李冬梅