我院张海涛教授、卢仁智副教授团队与机械科学与工程学院丁汉院士团队联合攻关...
12月11日,我院张海涛教授、卢仁智副教授与机械科学与工程学院丁汉院士联合团队在Nature Communications发表题为“Discovery of the Reward Function for Embodied Reinforcement Learning Agents (具身强化学习智能体的奖励函数发现)”的研究论文。论文提出了一种具身智能体自主发现最优奖励函数的框架,实现了智能体策略与奖励函数的协同进化。我院卢仁智副教授为第一作者,我院张海涛教授、西班牙纳瓦拉大学丁月民教授为论...