众所周知,2020年是个非常不寻常的年份。这一年大部分时间都关在家里,哪儿都去不了,现在疫情又肆虐了,希望明年暑假之前可以回复正常办公吧。
然而另一方面,效率大为提高,可算是因祸得福。这一年的研究工作质量与前两年相比有了一个比较大的进步,几条研究线路都出现了曙光,整体思路也越来越清楚了。
感谢众多给力的合作者们!
在多智能体合作方面,已经有联合策略搜索的一作文章被NeurIPS收录,并且我们在ICLR上也有两篇不错的投稿(见多智能体强化学习新工作和一种新的强化学习探索准则)。这方面的工作我在Simon Institute的RL workshop上给了一个invited talk。据此可以看到一些很好的未来研究方向,明年会继续。
在强化学习中学习行动空间并应用于黑盒优化,是另一篇被NeurIPS收录的文章,这个方向是我们新开的,实验效果也非常好。这篇文章在NeurIPS workshop上给了一个invited talk,在本次NeurIPS的黑盒优化竞赛中,第三名(JetBrains)和第八名(KAIST OSI)都独立实现并应用了我们的新方法,对此深感荣幸。
在多层神经网络理论方面,年初用学生-教师框架分析多层ReLU网络的文章中稿ICML,年末又将将此框架应用于像SimCLR/BYOL最新自监督方法,进行了理论分析,打开深度学习的黑盒子,产生了很多新的深层次理解。年末的这篇文章,在NeurIPS workshop开会时有很多人围观,问题都很详细,并且荣幸地给了本次workshop唯一一个contributed talk。这个方向有很多后续工作可做,敬请期待。
总的来说,自己的目标是:想要做能与最新实践结合的理论,还有存在理论解释的实用算法。
2020年过去了,这个目标有了一些起色。
今年发了三篇一作的文章,还有一篇共一的在路上。按照一般的逻辑,一般团队带头人不用做这么多一作。但我这边的方向相对偏难,并非简单套用已有框架,我们组也不像学术界,无法约束在读博士为了前途拼命,所以还是需要一个有经验的人带头,走精品路线建立品牌,然后大家才会有动力有兴趣一起做。在这种条件下,高屋建瓴只给思路常常不够,以身作则(lead by example)并且多多与厉害的伙伴们合作,才是王道。
另一个待在家里的副产品,是把一部一直以来想要写的小说基本写完了(知乎连载见此,主页版),并且很幸运地收到某位编辑的签约邀请。
现在想来,决定公开连载是个很重要的分水岭。决定连载前,写作效率很低,一章可以折腾整个周末,憋出几千字来,特别慢,特别抠细节,而且经常前后不一致,导致大量废稿和无意义文字。决定连载之后,有一种无形的压力在,就会自动去想怎么样才可以提高效率,逼得自己有整体规划和大纲约束,反过来,让写作水准有了一个大的提高。说说一部小说写了五年,其实真正有用的,也就醒悟之后的那部分时间。
希望明年能做得更好。
以上。