研究方向: 主要研究方向为强化学习和进化算法。他拥有计算机科学的专业背景,曾在机器人和强化学习领域相关的顶会如iccv、corl发表过论文。他现在主要关注如何训练智能体适应开放环境,以及学习多种任务。尽管如今的强化学习算法在游戏、机器人、生物结构等领域取得了突破,但是它仍然受限于诸如采样效率,现实模拟差异,奖励函数固定,有限观察等各种问题,距离真正的智能还很遥远。从生物智能的发展轨迹来看,是物种在开放环境中自主的学习,通过遗传将特征传递给子代,在适者生存的法则下才最终产生了智慧。他坚信进化和开放环境是两个最重要的缺失部分。