智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃

admin 6个月前 ( 04-22 07:14 ) 0条评论
摘要: 关注:决策智能与机器学习,每天学点AI干货一个大师级的人物可以推动一个领域的发展,深度强化学习的发展得益于强化学习在深度......


今日,你AI了没?

重视:决议方案智能与机器学习,每天学点AI干货



一个大师级的人物可以推进一个智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃范畴的开展,深度强化学习的开展得益于强化学习在深度学习和神经网络的推进效果下的快速前进,在整个深度强化学习的开展过程中,有那么一群顶尖学者起到了推进效果,下文将对每一位前沿学者进行介绍。


1

Richard S. Sutton

--Google科学家

Richard S. Sutton,是加拿大核算机科学家。现在他是阿尔伯塔大学核算机科学教授 和iCORE主席。萨顿被认为是现代核算强化学习的创始人之一,对该范畴有几项重要奉献,包含时刻差异学习和战略梯度办法,这两种办法为后来的强化学习开展起到了推进效果。

Sutton于1978年取得斯坦福大学心理学学士学位,硕士学位。别离于1980年和1984年在马萨诸塞大学阿默斯特分校取得核算机科学博士学位,并在Andrew Barto赛加可汗的监督下。他的博士论文“ 强化学习中的时刻信誉分配” 引入了行为者- 批判体系结构和“时刻信誉分配”两种办法。

http://www.incompleteideas.王烈麟net/


老爷子现在为强化学习的开展奉献了圣经等级的书本:

《Reinforcement Learning: An Introduction 》


《书本pdf链接》

http://incompleteideas.net/book/RLbook2018.pdf

《书本代码链接》

http://incompleteideas.net/book/first/code/code.html


学术奉献

《GoogleScholar地址》

https://scholar.google.ca/citations?user=6m4wv6gAAAAJ&hl=en



2

David Sliver

--Google DeepMind科学家

David Silver, 曾领导DeepMind的强化学习研讨小组,并担任AlphaGo哈皮虎的首席研讨员和AlphaStar的联合负责人。他于1997年结业于剑桥大学,取得Addison-Wesley奖,并在那里与Demis Hassabis【DeepMind创始人】结识。随后,Silver一起创办了视频游戏公司Elixir Studios,在那里他担任CTO和首席程序员,取得了多项技能和立异奖。2004年,他在阿尔伯塔大学回到学术界攻读博士学位,首要研讨强化学习,他介绍了第一个主级9x9 Go程序中运用的算法。他的MoGo程序版别(与Sylvain Gelly一起编撰)是到2009年最强壮的Go方案之一。Silver于2011年被授柳韩妃予皇家学会大学研讨奖学金,随后龙骨菜成为伦敦大学学院的讲师,现任教授。他的强化学习讲座可在YouTube上找到。Silver 从一开端就为DeepMind供给咨询,并于2013年全职参加。他最近的作业重点是将强化学习与深度学习相结合,包含一新新资料个学习直接从像素中学习Atari游戏的程序。Silver领导了AlphaGo项目,终究推出了第一个在Go全尺度游戏中打败尖端作业玩家的方案。AlphaGo随后取得了荣誉9段福卫五号专丧命情网业认证; 并因立异而取得戛纳狮子奖。然后他领导了AlphaZero的开发,在学习以相同的办法下棋和棋子之前,运用相同的AI来学习玩游戏(从头开端学习而不是从人类游戏中学习),到达比任何其他核算机程序更高的水平。


http://www0.cs.ucl.ac.uk/staff/d.silver/web/Home.html

现在他为强化学习开展奉献了经典课程《UCL强化学习课程》,这门课程首要依据sutton老爷子的书为根底进行解说,是现在强化学习原理与根底方面最经典的课程之一


《链接》

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html


他在围棋范畴最为经典代表是AlphaGo、AlphaZero等


学术奉献

《GoogleScholar地址》

https://schol智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃ar.google.com.sg/citations?user=-8DNE4UAAAAJ&hl=zh-CN&oi=sra


3

Pieter Abbeel

--OpenAI, UC Berceley科学家

Pieter Abbeel 教授是加州大学伯克利分校机器人与强化学习范畴的教授。他于比利时 KU Leuven 获电子工程学士、硕士学位,之后在斯坦福大学师从吴恩达,并于 2008 年取得博士学位。Pieter Abbeel 教授自 2008 年起在加州大学伯克利分校担任 教职。在攻读博士期间,Pieter Abbeel 教授宣布了多篇重要的学术论文,并与导师《吴恩达》智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃提出了学徒学习(Apprenticeship learning)这一强化学习的全新概念,2011 年,Pieter Abbeel 教授经过深度神经网络运用战略搜索所,完结了机器 人叠毛巾的演示,他也因此被MITTechnologyReview 评比为当年的“TR35”获奖者。Pieter Abbeel 教授同智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃时担任创业公司 Embodied Intelligence 的董事长兼首 席科学家。其研讨范畴为:机器学习和机器人技能范畴,他的研讨会集让机器人从人身上 学习(学徒学习),经过自己的测验和过错学习(强化学习),以及经过学习-学习 (元学习)加快技能的获取。"

http://people.eecs.berkeley.edu/~pabbeel/


他为强化学习的开展奉献了课程:

           CS 188 | Fall 2018


《pdf链接》

htt女人菜花病图片ps://inst.eecs.berkeley智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃.edu/~cs188/fa18/index.html


学术奉献

《GoogleScholar》

https://scholar.google.com.sg/citations?hl=zh-CN&user=vtwH6GkAAAAJ



4

Oriol Vinyals

--Google DeepMind科学家

Oriol Vinyals,现在正在研讨跨学科主题,包含Nelson Morgan监督下的语音辨认和信号处理,Ruzena Bajcsy的TeleImmersive技能,以及Trevor Darrell的核算机视觉和机器学习。他是2011年微软研讨博士奖学金的取得者。其从西班牙的加泰隆尼亚理工大学(University of Catalonia)完结电信工程及数学双学位之后,前往美国进修,在卡内基梅隆大学机器人学院完结了机器学习和电脑视觉的学位论文(undergrad thesis),接着又到加州大学圣地牙哥分校,取得核算机科学及工程(Computer Science and Engineering)硕士学位,2009年则进入加州大学伯克利分校(UC Berkeley)攻读电机及电脑科学(Electrical Engineering & Computer Science)博士,他也参加了伯克利的Overmind 方案。2015 年, Google 研讨团队宣布了一篇论文,他们透过电影对白来练习的谈天机器人(chatbot)竟然能跟人类议论笼统的人生议题。一开端研讨人员问了一些简略的问题,例如我的 VPN 连不上等IT问题,机器就像是一个专业的 IT 人员,作业得恰如其分,但人工少女3汉化版下载接着问它“生命的含义是什么”、“活着的意图是什么”等形而上的问题,机器别离说:“寻求最大的夸姣”、“为了永生”……等。对话让人从感觉从风趣变成了有点惊骇。而这个 chatbot的开发者便是 Oriol Vinyals 和他的搭档 Quoc V.Le 。


https://ai.google/research/people/OriolVinyals


他为深度强化学习的奉献首要是星际争霸游戏的智能体AlphaStar


学术奉献

【GoogleScholar】

https://scholar.go宣化上人讲冯冯居士ogle.com.sg/citations?hl=zh-CN&user=NkzyCvUAAAAJ


5

Volodymyr Mnih

--Google DeepMind科学家

Volodymyr Mnih,谷歌(Google DeepMind)的一位加拿大研讨科学家,具有深化学习方面的专业常识,领导团队致力于深化Q-N俞渭波etworks(DQN),把握Atari游戏[2]。DQN经过pong、space in侵略者、breakout和seaquest等游戏进行测验,只接纳像素和游戏分数作为输入,以逾越一切从前算法的功能,并在一组49个游戏中到达与专业的人类游戏测验人员适当的水平,运用相同的算法、网络架构和超级参数。Volodymyr mnih在 Geoffrey E. Hinton《2019年图灵奖取得者,反向传达、胶囊网络的提出者》的教训下在多伦多大学取得了机器学习博士学位,并在阿尔伯塔大学取得了核算机科学硕士学位,他的导师是csaba szepesv_ri。

http://www.cs.toronto.edu/~vmnih/


学术奉献

《GoogleScholar》

https://scholar.google.com/citations?user=rLdfJ1gAAAAJ&hl=zh-CN




6

Koray Kavukcuoglu

--Google DeepMind科学家

Koray Kavukcuoglu,谷歌 DeepMind的核算机科学家和研讨员,参加WaveNet语音组成体系,以及AlphaGo项目。他从Middle East Technical University大学取得航天工程学位,在纽约大学别离于2005年和2010年取得硕士和博士学位。他的研讨爱好会集在机器学习,包含神经网络和深度学习。与Ronan Collobert和ClmentFarabet,他是机器学习库Torch5 版别的开发者,也为后续版别做出了奉献。


他为强化学习的首要奉献除了论文之外,和前面几位科学家一起提出了强化学习结构《IMPALA: Scalable Distributed Deep-RL with Importance Weighted拔灰 Actor-Learner Architectures》

http://koray.kavukcuoglu.org/


学术奉献

《GoogleScholar》

https://scholar.google.com/cita饱足奶茶tions?hl=zh-CN&user=sGFyDIUAAAAJ

《Github》

https://github.com/koraykv



7

John Schulman

--OpenAI 科学家

John Schulman,是Openai的一名研讨科学家,其致力于强化学习(RL),特别是与搬运学习和元学习有关的。他在加州大学伯克利分校取得了核算机科学博士学位,并研讨机器人,使机器人可以打结和缝合,并运用轨道优化来方案运动。

他为强化学习所做的奉献在于提出了相信域战略梯度优化算法(Trust Region Policy Optimization),并宣布于顶会上,这篇论文是与大神Pieter Abbeel一起完结,他在其个人博士论文第三章作为独自章节进行了解说描绘,该算法成功的处理了战略梯度更新过程中的更新步长问题。


http://joschu.net/


学术奉献

《GoogleScholar》

https://scholar.google.com/citations?user=itSa94cAAAAJ&hl=zh-CN

《Github》

https://github.com/joschu




8

Sergey Levine

--UC Berkeley、Google科学家

Sergey Levine,是加州大学伯克利分校电气工程和核算机科学系的助理教授。其重视操控智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃和机器学习之间的交叉点,意图是开发算法和技能,使机器可以自主地取得履行杂乱使命的技能。特别是对怎么运用学习来取得杂乱的行为技能感爱好,以便赋予机器更大的自主性和智能性方面的研讨。

他于2009年取得斯坦福大学核算机科学学士和硕士学位,2014年取得斯坦福大学核算机科学博士学位。他于2016年秋季参加加州大学伯克利分校电气工程和核算机科学系。他的作业重点是决议方案和操控的机器学习,重点是深化学习和强化学习算法。他的著作的运用包含自动机器人和车辆,以及核算机视觉和图形。他的研讨包含开发感知和操控相结合的深层神经网络战略的端到端练习算法、逆强化学习的可扩展算法、深层强化学习算法等。他的少女之心全文阅览著作曾在许多盛行的媒体上宣布,包含《纽约时报》、《英国广播公司》、《麻省理工学院技能谈论》和《彭博商业》。


他为强化学习所做奉献首要会集在机器人操控范畴,并在伯克利大学开设了经典的强化学习课程《CS294》


http://people.eecs.berkeley.edu/~svlevine/


学术奉献

《GoogleScholar》

https://scholar.google.com/citations?hl=zh-CN&user=8枪恋33天R35rCwAAAAJ

《更多论文》

httpsphpshe://dblp.uni-trier.de/pers/hd/l/Levine:Ser黑涩会小蛮gey


9

Hado van Hasselt

--OpenAI 科学家

Hado van Hasselt,是谷歌DeepMind的研讨科学家。其研讨爱好包含人工智能、机器学习、深度学习,尤其是强化学习。此前,曾在阿尔伯塔大学与RichSutton协作。


他为强化学习所做的奉献是开设了UCL(2016)强化学习课程

http://people.cs.uu.nl/hado/


学术奉献

《GoogleScholar》

https://schola智联招聘,深度强化学习范畴盘点系列 | 大神篇,猕猴桃r.google.ch/citations?user=W80oBMkAAAAJ&hl=en



10

俞扬

--南京大学

俞扬博士,南京大学人工智能学院教授 ,别离于 2004 年和 2011 年取得南京大学核算机科学与技能系学士学位和博士学位 。

2011 年 8 月参加南京大学核算机科学与技能系、机器学习与数据发掘研讨所(LAMDA)从事教育与科研作业。曾获 2013 年全国优异博士学位论文奖、2011 年中国核算机学会优异博士学位论文奖。宣布论文 40 余篇,包含多篇 Artificial Intelligence、IJCAI、AAAI、NIPS、KDD 等世界一流期刊和会议上,研讨成果取得 IDEAL'16、GECCO'11、PAKDD'08 最佳论文奖,以及 PAKDD』06 数据发掘比赛冠军等。《Frontiers of Computer Science》青年副修改,任人工智能范畴世界尖端会议 IJCAI』15/17 高档程序委员、IJCAI'16/17 Publicity Chair、ICDM'16 Publicity Chair、ACML'16 Workshop Chair。辅导的学生获天猫「双十一」引荐大赛百万大奖、Google 奖学金等


http://lamda.nju.edu.cn/yuy/default.aspx?AspxAutoDetectCookieSupport=1


学术奉献

《GoogleScholar》

https://scholar.google.com/citations?user=PG2lDSwAAAAJ&hl=zh-CN


注:部分图片引证版权仅学习运用,请勿商业用途。


以上是现在在强化学习范畴具有代表性的学者,其间国内比较少,部分国外还没有搜集完好,受篇幅约束仅介绍了10位,后续继续更新最新最前沿的大牛。


来历阐明

作者 | DeepRL

出处 | 深度强化学习算法(ID: Deep-RL)


文章引荐


文章版权及转载声明:

作者:admin本文地址:http://www.chabbu.com/articles/1125.html发布于 6个月前 ( 04-22 07:14 )
文章转载或复制请以超链接形式并注明出处查补数学,中考数学,高考数学,大学数学,学好数学称为数据科学家