DeepMind|DeepMind联合UCL，推出2021强化学习最新课程( 二 )_Hasselt|Hado|Hessel|

文章图片

第 9 讲策略梯度和 Actor-Critic 方法：Hado van Hasselt 讲述了可以直接学习策略的策略算法，并进一步讲解了结合价值预测以提高学习效率的 actor critic 算法。
第 10 讲近似动态规划：Diana Borsa 讲解了近似动态规划算法，探讨了如何从理论的角度分析近似算法的性能。
第 11 讲多步和 off-policy：Hado van Hasselt 讲解了多步和 off-policy 算法，包括多种减小方差的方法。
第 12 讲深度强化学习 #1：Matteo Hessel 讲解了深度强化学习的实际要求和具体算法，以及如何使用自动微分（Jax）来实现。
第 13 讲深度强化学习 #2：Matteo Hessel 讲解了通用价值函数（general value functions）、基于 GVF 的辅助任务，并进一步讲解了如何处理算法中的扩展问题。
DeepMind 研究者亲自授课
该系列课程的讲师是 DeepMind 的研究科学家和工程师 Hado van Hasselt、Diana Borsa 和 Matteo Hessel 。
Hado van Hasselt

文章图片

Hado van Hasselt 是 DeepMind 的一名研究科学家，也是伦敦大学学院（UCL）的荣誉教授。 Hado van Hasselt 博士毕业于世界顶尖公立研究型大学和百强名校乌得勒支大学，他的研究兴趣包括人工智能、机器学习、深度学习，并重点研究强化学习。
Diana Borsa

文章图片

Diana Borsa 是 DeepMind 的研究科学家，也是 UCL 的荣誉讲师。她的研究兴趣主要是强化学习、机器学习、统计学习和通用人工智能（AGI），涵盖智能体学习、交互系统、多智能体系统、概率建模、表征学习等。
【DeepMind|DeepMind联合UCL，推出2021强化学习最新课程】Matteo Hessel

文章图片

Matteo Hessel 是 DeepMind 的一位研究工程师，也是 UCL 的荣誉讲师。他的研究重点是强化学习及其与深度学习的结合。 Hessel 曾在 NeurIPS、ICML、ICLR、AAAI 和 RLDM 上发表过十余篇论文，这些论文的引用次数超过 4000 次，并获得了 2 项注册专利。

DeepMind|DeepMind联合UCL，推出2021强化学习最新课程( 二 )

推荐阅读

女人吃红薯的8大好处

十字怎么剪比较简单的剪法

狗狗白眼球红怎么回事

明日之后黄麻杆怎么获得，明日之后黄麻杆在哪里获得

跳高加油稿简短为跳高运动员加油稿

狗可以喝粥吗

关于一个人定力的句子有定力的句子范例

3种方法来要回被父母收走的手机

大棚草莓十三吗啉

金橘酒的做法：

接吻会传染病菌吗 10大健康谣言

白鹿镇好玩吗

老年健身广场舞的好处

金水宝降肌酐吗不宜长期服用

玫瑰三花茶是哪三花

虞世南是虞舜的后代吗？

红木家具中到底有没有胶，为什么？

找到老公的私房钱第25关怎么过

鱼肝油的作用鱼肝油介绍

减水剂每立方的用量