日前,在法国里昂召开的第27届国际万维网大会(The Web Conference 2018, 原世界万维网大会WWW)上,大会主席Pierre-Antoine Champin宣布将大会三大奖之一 —— 唯一最佳海报论文奖(Best Poster Award)颁给清华大学电子工程系金德鹏教授、李勇副教授团队与新加坡国立大学合作完成的论文《基于用户点击数据的贝叶斯个性化排序采样器优化设计》“An Improved Sampler for Bayesian Personalized Ranking by Leveraging View Data”。该论文第一作者为清华大学电子系博士生丁璟韬(导师为金德鹏教授),参与的学生还有电子系本科生于光辉。

大数据时代的用户行为预测机遇与挑战并存:海量数据对算法效率提出了新的要求,而蕴含在多源数据中的复杂用户行为需要更加精准全面的建模。本论文研究了用户行为预测中贝叶斯个性化排序算法(简称BPR)的采样器优化问题,解决了普遍存在的负样本采样低效和用户隐反馈行为稀疏两大难题。针对第一个难题,论文提出了对不同用户缩减负样本候选集的思路,发现将集合缩小至全样本集合的0.1%~1%时,仍然能够取得相近的预测性能,从而实现了采样器效率的大幅度提升;针对第二个难题,论文结合多源数据中用户行为的丰富特性,有效利用用户的辅助反馈数据更加精准的建模用户的喜好。该工作与国内母婴垂直电商领域独角兽企业——贝贝集团合作,在贝贝网线上环境测试中的结果表明该行为预测算法应用于百万用户的商品推荐时,转化率、曝光价值等指标有效提升12%~20%。
同时,课题组在会议上发表了一篇长文:《使用基于注意力机制的循环神经网络预测个体移动》“DeepMove: Predicting Human Mobility with Attentional Recurrent Networks”(第一作者为博士生冯杰,导师为李勇副教授)。该工作第一次将注意力机制引入人类移动行为预测领域,在显著提升基于深度学习方法的个体移动预测准确率的同时,可以给出预测成功背后的规律性解释,为实现可解释性的人类行为预测提供了一种极具潜力的研究思路。
国际万维网大会(The Web Conference/WWW)由国际万维网会议委员会(IW3C2)发起,作为极具国际声誉的权威性互联网技术学术会议,至今已成功举办26届,是网络系统与应用交叉领域的顶级学术会议,也被列为《中国计算机学会推荐国际学术会议和期刊目录》中交叉/综合/新兴类的A类学术会议。自1994年起,全球的专家学者汇聚在WWW大会上,包括国际著名大学、研究机构、跨国企业和国际标准化组织的一流学者与业界精英,共同探讨与互联网相关的前沿技术,持续推动互联网技术的发展与创新。其中WWW于1998年的会议曾收录了谷歌的经典搜索引擎论文。