第二届AI模拟与智能决策论坛成功举办

发布时间：2022-07-19 点击数：次

为什么AI能让决策更智能？如何让AI帮助我们实现更智能的决策？这不仅是现代科技发展的前沿，更是当下社会现代化治理和企业数智化转型过程的关键举措和必由之路。

7月2日，由清华大学电子工程系主办，清华大学电子工程系城市科学与计算研究中心承办、北京清鹏智能科技有限公司协办，机器之心、集智俱乐部、科学家在线等多家科技前沿媒体支持的第二届“AI模拟与智能决策”论坛在京线上线下同步举办，吸引超万人次实时观看互动。

清华大学电子工程系教授、系党委书记金德鹏，新加坡科研局新加坡制造技术研究院科学家Cao Zhiguang，杭州云栖工程院首席科学家黎珍辉，阿里巴巴达摩院决策智能实验室负责人印卧涛，天津大学智算学部副教授、华为诺亚决策推理实验室主任郝建业，南方科技大学计算机系教授唐珂，清华大学电子工程系长聘副教授李勇，清鹏智能创始人兼CEO李中阳等全球顶尖专家学者、知名企业与创业公司负责人出席了此次论坛，共同探讨智能模拟与决策领域的前沿问题，如何推动关键科学技术的快速发展，促进相关领域的创新与实践落地。

李勇（第一排左）唐珂（第一排中）黎珍辉（第一排右）Cao Zhiguang（第二排左）印卧涛（第二排中）李中阳（第二排右）金德鹏（第三排左）郝建业（第三排右）

部分线下会场

多平台线上会场

论坛伊始，清华大学电子工程系教授、系党委书记金德鹏代表电子系致开幕词。今年是电子系70年的系庆，金德鹏首先总结了电子系自1952年至今在科学研究、服务社会等方面取得的瞩目成就，并介绍了电子系建设国际顶尖的电子工程学科的目标定位和未来的发展方向。在这个目标的引导下，电子系采取了一系列的改革，此次论坛就是改革的方向之一，即开展开门学术活动。希望通过各类开门学术活动吸引更多的学者参与到科学技术的研讨中来，为学科的发展做出自己的贡献。金德鹏强调了AI决策在AI领域中的重要位置，并介绍了李勇团队在AI决策特别是城市决策中的相关研究工作。最后，金德鹏对各位参加论坛的嘉宾表达了感谢，并预祝此次论坛圆满成功。

清

华大学电子工程系教授、系党委书记金德鹏

论坛嘉宾精彩报告回顾

Cao Zhiguang:《Learning to Solve Vehicle Routing Problems》

Cao Zhiguang分享

新加坡科研局新加坡制造技术研究院科学家Cao Zhiguang与我们分享了《学习求解车辆路径问题》的主题报告，它属于“学习优化”这一近年来在AI和运筹优化研究中十分热门的领域。带容量约束的车辆路由问题(CVRP)和旅行商问题(TSP)都是NP难的，精确求解要花费很长的时间，在现实中对于大规模问题的求解更多地是使用一些由专家手工设计的启发式方法。新兴的神经启发式方法从直观上来说是希望从大量数据中学习到问题内涵的结构和模式，从而更快和更好地求解。神经启发式方法可以分构造式和迭代式，前者直接输出解，后者会在初始解的基础上不断迭代改进。

Cao Zhiguang详细介绍了这两方面的代表性工作，并在最后的总结中指出，尽管神经启发式方法正在飞速发展，但目前想要超过传统方法仍然面临着诸多挑战，例如解决不同分布、不同规模的数据集上的泛化性问题，以及处理更为困难的组合优化问题中的复杂约束条件等。

黎珍辉：《Open Data Research Toward a Science of Cities》

黎珍辉分享

杭州云栖工程院首席科学家黎珍辉强调了数据集公开对于城市科学研究的重要意义。如果所需要的数据集未公开，则对于该数据的后续研究人员带来很多的困难与阻碍，但是拥有足够的公开数据可以促进更多有意义的问题研究，城市科学中patents, GDP, housing, gasoline station等很多问题都值得讨论研究，并得到有意思的结论。例如，大家通常认为降水量与用水量之间会存在某种关系，为研究该问题，黎老师找了100多个城市的公开数据集进行分析，最终发现一个城市的降水量和用水量关系不大。

最后，黎珍辉提到第四范式研究（data-driven research）的重要性，即并不是单纯的方法驱动、技术驱动，要更多地去思考数据背后的深刻问题。数据集公开可以帮助研究人员无壁垒地开展研究工作，她希望大家积极参与到构建公开数据库的工作中，共同促进城市科学的发展。

印卧涛：《Learning to Optimize: Algorithmic Unfolding》

印卧涛分享

阿里巴巴达摩院决策智能实验室负责人印卧涛首先介绍了“learning to optimize”的基本定义，它是一种机器学习与优化相结合的方法，通过学习“优化记录”，更快得到更好的优化方案。它有两种范式——一种是完全数据驱动的无模型范式；另一种是基于模型的范式，相比来说，该范式稳定性更强，训练时收敛更快。“算法展开”就是该范式的一种代表性方法，它包括两个步骤：首先是选择一个经典的优化算法，并展开到一个神经网络；然后选择一组神经网络参数进行学习。实验表明，该方法在性能和速度方面都远超其他方法。

该领域目前还面临三个问题：训练速度慢、可解释性差以及泛化性差。就训练速度慢而言，印卧涛提到，可以通过引入耦合以及改善迭代方法提高训练的速度与稳定性，并表示该领域目前还有很大的创作空间，期待大家能够更多地参与进来。

郝建业：《Self-supervised Reinforcement Learning》

郝建业分享

天津大学智算学部副教授、华为诺亚决策推理实验室主任郝建业介绍了自监督强化学习的构建方法论，包括通过构建对比样本，学习更好的状态表征；将策略表示通过自监督的方式嵌入，构建对比学习；将动作作用前后的状态进行编码，并尝试解码还原出动作，得到自监督的动作表征；通过对环境有限次数的交互学习环境表征，在新的环境下更新表征并快速适应新任务等。郝建业指出，当前自监督强化学习模型仍只对相似任务表现出了有限的泛化能力，但其提高探索效率、泛化性的特性，是实现通用决策大模型的潜在关键技术，具体如何实现正在被开放的探索中。

关于模拟和决策这两大主题，郝建业认为，对于实际工业场景的复杂决策问题，机器学习求解的黑盒方法普适性更强，但面临训练数据难以获得的重大挑战。而模拟能够快速、低成本地产生大量逼真的数据用于模型训练，模拟将是把黑盒决策做到工业落地的必经之路。

城市模拟器2.0发布

李勇：《城市模拟器2.0发布》

李勇分享

清华大学电子工程系副教授李勇从城市模拟的机理模型、方法论、软件架构等多个角度向大家汇报并发布了城市模拟器2.0版本并回答了三个城市模拟的核心问题：模拟什么、有什么用、如何实现。面对纷繁复杂的城市，城市模拟器将城市建模为物理要素与社会要素的组合，由人在AOI之间的空间位移、人的需求驱动基础设施网络使用、基础设施网络连接AOI构成大规模城市模拟。

为了解决现有方法存在的模型不完备、数据采样有偏、泛化能力差等问题，李勇老师阐述了城市模拟器2.0中应用的知识数据协同驱动的模拟方法。在机理模型的基础上，城市模拟器能够完成推演决策任务，回答以前难以回答的科学问题。最后，李勇老师针对大规模城市模拟的特点与难点，介绍了大规模城市全尺度微宏观一体模拟的分布式异构加速实现方案，并概要了城市模拟器2.0的五大系统能力。

张国祯：《模拟技术：知识数据协同驱动的人流模拟》

张国祯分享

清华大学电子工程系博士生张国祯介绍了城市模拟器中的底层核心算法之一——知识数据协同驱动的人流模拟。基于这一算法，模拟器从微观出发模拟出每个人的微观移动行为，并构建起了整个城市的模拟。具体来说，算法的核心是基于知识数据有事互补的思想，即传统算法中，基于公式的物理模型具有较好的可泛化性，但是难以刻画复杂的人类行为；基于数据的神经网络等方法则泛化性弱，但能够较好刻画人类复杂的行为。因此，团队提出了一个框架来同时利用物理模型和神经网络的优势，实现真实而鲁棒的人流模拟。最后，张国祯博士具体介绍了他们在人流模拟场景对这一框架的实现，并总结到知识数据协同驱动的模拟是一个极具前景的研究方向。

宗泽方：《决策技术：基于强化学习的大规模路径优化》

宗泽方分享

清华大学电子工程系博士生宗泽方介绍了大规模决策优化的相关具体技术场景——基于强化学习求解大规模路径优化(VRP)问题。用分治法的思想求解大规模VRP问题是一种常见思路。传统方法往往基于知识先验的方法，对结点进行空间分区从而进行分治求解，但分区方法却极为粗糙和不鲁棒。设计一种数据驱动的分区算法框架能够显著提升整体决策质量。基于此，基于多种解结构的表征-分区方式结果的优化数据，通过强化学习的训练手段，不断获取更好的优化结果。实验结果表明，该框架在优化质量取得了显著的效果提升，并具有较好的数据鲁棒性和场景鲁棒性。最后，他总结了大规模决策优化的未来研究方向，包括大规模决策优化通用性，分级决策耦合训练，以及兼顾大规模与动态性的场景研究。

“智能决策技术的发展与未来”圆桌讨论

唐珂（左上）、郝建业（右上）

印卧涛（左下）、李中阳（右下）

除了嘉宾精彩的主题分享外，此次论坛还进行了“智能决策技术的发展与未来”圆桌讨论。针对智能决策领域的痛点问题，印卧涛强调，决策从理论到实践落地都比较复杂，需要一个模拟平台进行问题抽象；郝建业认为，黑盒优化决策的普适性更强，但实际工业场景下如何快速、真实、低成本地获取大量训练数据是最大的挑战，模拟将是一个有效手段；李中阳认为，虽然白盒的数学建模和规划求解范式已经发展了几十年，但真实的产品应用中，往往在建模上遇到关键挑战。由于场景的多样性、动态性和复杂的隐变量，要做一个与真实世界高度一致的建模很难。

此外，还就模拟与决策的融合进行了一系列探讨，郝建业认为，真正把大规模决策做到落地，模拟是必经之路；印卧涛指出，要找到建模和求解的平衡点，机器学习可以将链条缩短，通过数据注入的方式减小专家进行问题建模的代价；而李中阳则提到，“模拟+决策”的范式一定是未来，但也存在一定的挑战。一方面，从商业产品降低边际成本的需求来看，需要推动模拟决策工具链的标准化，更少地依赖面对特定的问题进行很多知识导入等非标准化的工作；另一方面，又要能够切实解决企业复杂多样的具体问题，这是一个很难的trade-off。

供稿 | 城市科学与计算研究中心

编辑｜徐璇、陶旋姿

审核｜汪玉、李冬梅

分享到：

电子新闻

第二届AI模拟与智能决策论坛成功举办