Skip to content

知名高校和课题组

国内外做强化学习的老师,高校以及公司总结

本文总结了一些国内外做强化学习的高校、公司以及老师等,欢迎大家一起补充完善。

一、学术界

1.1 国外
  • 伯克利: Sergey Levine(论文高产作者)、Pieter Abbel(和Levine并列)

  • UCL: David Sliver(目前好像不指导学生了)、汪军老师等

  • Alberta:Richard Sutton老爷子、好几个理论的@蓝青峰大佬

  • Stanford:Benjamin Van Roy

  • 莫斯科国立大学:NIPS比赛很强

  • 巴黎Flowers Team:Intrinsic motivation方向

  • 新加坡南洋理工大学:> > 安波老师

1.2 香港
1.3 国内
  • 清华大学:张崇洁老师、李升波老师等

  • 北京大学:卢宗青老师等

  • 南京大学: 俞扬老师、高阳老师等

  • 上海交通大学: 张伟楠老师、俞凯老师(Reinforcement Learning: An Introduction书翻译作者)等

  • 中国科学院: 赵冬斌老师、张海峰老师等

  • 天津大学:郝建业老师等

  • 中科大: 李厚强老师、周文罡老师、王杰老师、庄连生老师等

  • 国防科技大学: 徐昕老师

  • 中科院深圳先进技术研究院: 崔允端老师(强化学习在自动驾驶、机器控制上的应用)

二、工业界

2.1 国外
  • DeepMind(David Sliver, Marc G. Bellemare)

  • OpenAI(John Schulman)

  • FAIR(全方向):知名的有田渊栋和Noam Brown等,大佬巨多

  • Google Brain(全方向):大佬巨多

  • Salesforce Research

2.2 国内
  • 腾讯AI Lab:游戏等;

  • 百度PARL团队:自研框架+RL比赛

  • 网易伏羲实验室:游戏;

  • 字节跳动AI Lab:游戏、推荐;

  • 地平线AI:RL+机器人、自动驾驶

  • 滴滴:运筹优化;

  • 阿里:推荐、运筹优化;

  • 微软亚研院:Research,信息检索和搜索引擎;

  • 华为诺亚方舟实验室:Research;

  • 华为消费者BG自动驾驶解决方案BU:RL+自动驾驶

  • 平安保险:强化学习+NLP;

  • 快手AI Lab:游戏、检索;

  • Momenta:RL+自动驾驶

  • 超参数科技:游戏;

  • 启元世界

  • 南栖仙策

-