[访谈]北京青年优秀科技论文一等奖获得者马占宇

作者:蝌蚪君来源:蝌蚪五线谱发布时间:2018-02-28

北京青年优秀科技论文一等奖获得者访谈……

马占宇

马占宇(照片由本人提供)

本次获奖论文主要观点:

本文提出了一种用于有界数据的贝叶斯矩阵因数分解法。假设观察矩阵中的所有元素都服从Beta分布。由于Beta分布具有两个参数,因此可以获得两个只含有非负元素的参数矩阵,通过非负矩阵因数分解(NMF)方法进行低阶矩阵分解。与此同时,因子分解矩阵,即基础矩阵和激励矩阵中的每一项,都使用Gamma先验赋值。因此,我们将这个方法命名为Beta-Gamma NMF(BG-NMF)。由于Gamma函数的积分表示形式,无法使用便于分析的办法估计BG-NMF模型中的后验分布。根据变分推理框架与log-inverse-beta函数的相对凸度属性,我们提出了一个新的下界来拟合目标函数。通过新的下界,我们得到一个易于分析的方法来估计后验分布。每个近似的后验分布也是Gamma分布,这使它们保留了贝叶斯估计的共轭性。此外,通过在Gamma先验中加入稀疏约束,可以得到稀疏的BG-NMF方法。利用人工生成数据与现实数据所做的评估证明了BG-NMF方法的良好性能。

请用一句话介绍下自己:

A=行千里路

B=读万卷书

A>B

通过什么途径获得参赛信息,参加的初衷是什么?

大约是2年之前,我是在第十三届比赛结果公布的时候知道了有这样一个北京市科协组织的面向北京市青年科技工作者的论文评比,当时就非常希望有机会能够参与。此次比赛,我是通过北京自动化学会的通知得到了消息。接到通知后,我第一时间就报了名。

参赛的初衷也很简单,就是希望通过这样一个平台,多一个了解青年同行们的工作成果、互相交流、互相学习的机会,同时也向大家汇报一下近年来的工作进展。在比赛现场,我也和很多来自其他高校、科研院所的同行们进行了深入的交流。

为什么选择从事学术研究?

我走上学术研究这条路,受我的硕士生导师、北京邮电大学副校长郭军教授影响很大。郭老师是一个治学严谨的学者,从日本留学回国后,就一直从事人工智能、模式识别领域的研究。尽管担任(过)学院院长、学校副校长等行政职务,也是海淀区人大代表和北京市政协委员,但是他始终没有脱离学术研究的第一线,既注重原创性成果的产生,也重视理论与实践的结合,既注重创新型团队的建设,也关注优秀人才的培养。20多年来,郭老师带领北邮模式识别与智能系统实验室取得了令人瞩目的成果,发表了大量高水平的学术论文,承担了863、重大专项、自然科学基金等重要科研项目,与企业合作成立了多个校企联合实验室共同从事工程领域的研究开发,荣获了多个有影响力的科技奖项,形成了一支年龄结构合理、具有朝气和创新开拓精神的科研团队,有教师20余人,学生200余人。

成为北邮模式识别实验室的学生,是我人生成长道路上的一件幸事。以郭老师为代表的模式识别团队老师们多年来耕耘不辍,形成了严谨、活泼、团结、进取的风格,对我影响很大。平日里,师生们共同探讨学术问题时的严肃与认真,解决问题之后的兴奋与轻松,让我感到学术研究是一项既蕴含挑战又充满快乐的事情;而实验室取得的一个个创新性成果,培养的一批批优秀人才,让我又觉得学术研究是一件神圣而有意义的工作。

郭老师还十分关心学生个人的成长。就在我准备硕士论文的时候,国家留学基金委启动了“国家建设高水平大学公派留学生项目”。得到这个消息之后,郭老师第一时间通知并且鼓励我出国深造。应该说,北邮模式识别实验室宽松活泼的工作环境和鼓励创新的科研氛围,与国外高校的环境很相似。有了多年实验室的熏陶,我很容易就融入到了新的环境中,博士学业进展也比较顺利。在国外读书期间,我始终念念不忘北邮模式识别实验室。因此,在瑞典皇家工学院完成博士论文之后,我就立刻联系了郭老师,表达了回北邮从事科研工作的愿望。很幸运,我又回到了北邮,再次成为北邮模式识别实验室的一员。

回国之后,实验室给了我提供了宽松的科研环境和很大的选题自主权,使我能够专心从事我感兴趣的研究工作;与此同时,实验室的老师们也不断对我个人成长给予了多方面的支持。团队的帮助,使我很快就完成了角色转换,能够全身心的投入到科研和教学工作中去。在接下来的一个时期,我希望继续积极探索、主动实践,探求充满挑战的未知世界,解决更多的实际问题。

你怎么看待把科技研究成果科普化这件事?

科学研究是一个系统工程,涉及大量的专业术语、逻辑推导,需要一些专门/特定的条件,采用特殊的方式方法才可以实现。因此,从事科研工作的人员,需要经过长期专业的训练才能够胜任。很多科研成果是通过科技论文的形式体现的,对于专业领域以外的人,或者说非专业人士来说,本专业的词汇就会显得晦涩难懂,而本专业开展科研工作的背景、需要的条件、过程的困难程度、结果的重要意义,也更不容易被理解。因此,把科研成果通过科普的方式进行普及,采用通俗易懂的语言进行介绍,列举生动形象的例子加以说明,使得非本专业的人士能够理解、了解,对于科研成果的进一步推广和普及,提高广大群众的科技水平,是很有必要的、也是非常有意义的工作。

你获奖论文写作过程中有什么难忘的记忆?

这篇论文的产生过程还是挺曲折的。在2007年开始读博士时,就有了关于本篇论文核心创新点的想法。但是由于缺乏经验,我在算法推导和实施的时候出现了错误,始终无法得到正确的结果,所以就暂时搁置了起来。直到博士的第四年(2011年)准备答辩论文的时候,由于需要阅读相关文献,我才又有机会重新检查当初的推导,发现了错误之处。很快,错误被修正了,实验结果也是令人信服和满意的。我们满怀信心,把文章投稿到机器学习领域的顶级会议ICML。

本以为文章会顺利产生,可是又出现了插曲。ICML的一位审稿人指出,虽然我们的结果很好,但是算法推导过程中有一个近似步骤有问题,从而导致无法从理论上证明算法的收敛性。于是,文章被拒收。我们后来又花了将近2年的时间来修改我们的工作。功夫不负有心人,我们终于把问题找到,提出了新的近似思路,从理论上证明了算法的收敛性。等到文章再次投出,已经是2013年5月,几经修改,最终见刊是2015年的4月。文章最终被人工智能领域顶级期刊之一IEEE TPAMI录用,也算是对多年努力的一个交代。

由此可见,科研工作很难一帆风顺,很多时候会一波三折。但是只要坚持下去,一定会有回报。

能否讲述以往的科研\科普经历中最难忘\尴尬\激动的一次?

文章最终被录用的时候,我还是很兴奋的,一方面是因为被IEEE TPAMI录用,另一方面是多年的努力得到了认可。

有没有什么心得/体会/经验/教训想要跟其他参赛选手或者未来的参赛选手分享的?

经验谈不上,说一下个人的感受。从现场答辩的经历看,在短时间内组织好语言,把自己文章的主要贡献说清楚,给评委一个好的印象,还是十分重要的。

对于北京市科协举办的北京青年科技论文比赛有什么想说的话?

感谢北京市科协举办这样一个有意义的活动,给了青年科技工作者一个展示和交流的平台。比赛奖项的含金量很高,对于获奖者是一个很好的鼓励和鞭策。特别是本次比赛第一次引入现场答辩环节,即使对论文作者的一个现场检验,也是一个促进学术交流的机会。希望此项比赛继续举办下去,也预祝后面的活动越来越成功!

姓名: 马占宇

获奖情况:一等奖

论文题目: Variational Bayesian Matrix Factorization for Bounded Support Data

年龄:35    

工作单位: 北京邮电大学

专业:模式识别与机器学习

爱好:读书、旅行

学习与工作经历:

工作及科研经历

2014年12月至今                  北京邮电大学               副教授

2015年7月至2020年6月         丹麦奥尔堡大学       兼职副教授( Ajunct Assoc. Prof.)

2014年7月至2014年8月         英国伦敦大学学院       访问学者

2013年8月至2014年11月           北京邮电大学           讲师

2012年1月至2013年6月           瑞典皇家理工学院   博士后研究员

教育经历

2007年9月至2011年12月       瑞典皇家理工学院             博士

2004年9月至2007年4月             北京邮电大学                 硕士

2000年9月至2004年7月             北京邮电大学                 学士


扫码加蝌蚪五线谱微信