深度强化学习2.0 (Deep Reinforcement Learning 2.0)
深度Q-learning,策略梯度,演员评论家模型以及DDPG模型的完美结合
Description
欢迎来到深度强化学习2.0!
在这个课程中,我们回学习并且实现一个新的AI模型,较早双延迟DDPG。它是包括了当前最先进的人工智能技术,包括连续性双深度Q-learning,策略梯度,以及演员评论家模型。这个模型非常的强大,利用它,我们可以在课程中第一次解决最具有挑战性的AI问题(训练一个蚂蚁/蜘蛛,以及一个半人形机器人,让它走路或者跑过原野)。
为了构建这个模型,我们分成三步来处理:
第一部分:基础讲解
在这一部分中,我们会学习人工智能的所有必须基础部分。这部分之后,大家可以掌握AI的基础知识,其中包括,Q-Learning,深度Q-learning,策略梯度,演员评论家模型以及更多。
第二部分:双延迟DDPG理论
这一部分中我们会深入学习整个模型背后的理论知识。大家会通过一系列的视觉呈现幻灯片,清楚看到完整的AI构建以及训练的过程。不仅大家可以学到理论知识的细节,同时还可以构建坚实的AI学习以及运作的理论基础。第一部分中的理论基础,结合第二部分的细节解释,会让这些高不可攀的技术,在你面前变得唾手可得。最终大家会成为,少数一批最先掌握这门技术的人。
第三部分:双延迟DDPG的实现
我们会从最基础开始构建这个模型,一步一步,通过互动的部分,这也是这一课程新增加的一个亮点,大家可以自己练习代码的实现部分,跟我们一起进行模型的实现。通过这些练习,大家不再只是被动地跟着课程走,而是主动地、更有效地提高技术。最后还有一点很重要的是,我们所有的实现部分都会放在Colaboratory中来做,也叫做Google Colab,这是一个完全免费的开源的人工智能平台,让大家可以进行编码,训练AI模型,而免去在自己的机器上安装各种资源包的困扰。换句话说,大家在执行代码的时候,可以百分百的确信,可以最后拿到蜘蛛以及半人形机器人的训练视频。
What You Will Learn!
- Q-Learning
- 深度Q-Learning
- 策略梯度
- 演员评论家模型
- 深度确定性策略梯度(DDPG)
- 双延迟DDPG
- 深度强化学习的基本技术
- 如何运用最先进的AI技术训练模型来解决最具有挑战性的问题
Who Should Attend!
- 想要进一步学习AI技术的大数据科学家
- 想要拓展知识领域的AI专家
- 在科技和自动化领域工作的工程师
- 想要在商业游戏中获得领先的企业家以及公司
- 学习技术课程,并且想要未来从事数据科学,机器学习,或者人工智能领域工作的学生
- 其他对人工智能有兴趣的人