Skip to content

Hans's notebook

知名高校和课题组

知名高校和课题组

国内外做强化学习的老师，高校以及公司总结¶

本文总结了一些国内外做强化学习的高校、公司以及老师等，欢迎大家一起补充完善。

一、学术界¶

1.1 国外¶

伯克利： Sergey Levine(论文高产作者)、Pieter Abbel（和Levine并列）
UCL： David Sliver(目前好像不指导学生了)、汪军老师等
Alberta：Richard Sutton老爷子、好几个理论的@蓝青峰大佬
Stanford：Benjamin Van Roy
莫斯科国立大学：NIPS比赛很强
巴黎Flowers Team：Intrinsic motivation方向
新加坡南洋理工大学：> > 安波老师

1.2 香港¶

香港中文大学：周博磊老师
香港中文大学（深圳）：> > Jim Dai> 、> > Hongyuan Zha> 、> > Baoxiang Wang

1.3 国内¶

清华大学：张崇洁老师、李升波老师等
北京大学：卢宗青老师等
南京大学：俞扬老师、高阳老师等
上海交通大学：张伟楠老师、俞凯老师（Reinforcement Learning: An Introduction书翻译作者）等
中国科学院：赵冬斌老师、张海峰老师等
天津大学：郝建业老师等
中科大：李厚强老师、周文罡老师、王杰老师、庄连生老师等
国防科技大学：徐昕老师
中科院深圳先进技术研究院: 崔允端老师(强化学习在自动驾驶、机器控制上的应用)

二、工业界¶

2.1 国外¶

DeepMind(David Sliver, Marc G. Bellemare)
OpenAI(John Schulman)
FAIR（全方向）：知名的有田渊栋和Noam Brown等，大佬巨多
Google Brain（全方向）：大佬巨多
Salesforce Research

2.2 国内¶

腾讯AI Lab：游戏等；
百度PARL团队：自研框架+RL比赛
网易伏羲实验室：游戏；
字节跳动AI Lab：游戏、推荐；
地平线AI：RL+机器人、自动驾驶
滴滴：运筹优化；
阿里：推荐、运筹优化；
微软亚研院：Research，信息检索和搜索引擎；
华为诺亚方舟实验室：Research；
华为消费者BG自动驾驶解决方案BU：RL+自动驾驶
平安保险：强化学习+NLP；
快手AI Lab：游戏、检索；
Momenta：RL+自动驾驶
超参数科技：游戏；
启元世界
南栖仙策

-