深入浅出强化学习:原理入门
  • 推荐0
  • 收藏0
  • 浏览281

深入浅出强化学习:原理入门

郭宪 方勇纯 (作者) 

  • 书  号:978-7-121-32918-0
  • 出版日期:2018-01-01
  • 页  数:
  • 开  本:
  • 出版状态:上市销售
  • 维护人:刘皎

相关图书

智能时代财务管理

董皓 (作者)

本书讲述了人工智能时代来临时,财务人将面对怎样的环境变化、组织与模式变革,需要进行怎样的能力与认知的提升,从财务人视角展示了大数据、云计算、区块链、人工智能等新...

¥69.00

深度学习:一起玩转TensorLayer

董豪 郭毅可 杨光 (作者)

本书由TensorLayer作者领衔写作,TensorLayer社区众包完成,作者全部来自一线人工智能研究员和工程师,内容不仅覆盖了传统书籍都有的多层网络、卷积...

¥99.00

从芯片到云端:Python物联网全栈开发实践

刘凯 (作者)

物联网开发重新定义了“全栈开发”的范围。Python作为一门快速发展的语言,已经成为系统集成领域的优选语言之一,其可覆盖从电路逻辑设计到大数据分析的物联网端到端...

 

自然语言处理技术入门与实战

兰红云 (作者)

本书主要从语义模型详解、自然语言处理系统基础算法和系统案例实战三个方面,介绍了自然语言处理中相关的一些技术。对于每一个算法又分别从应用原理、数学原理、代码实现,...

¥59.00

相关性搜索:利用Solr与Elasticsearch创建智能应用

Doug Turnbull John Berryman (作者) 莫映 蔡宇飞 殷志勇 (译者)

本书揭开了相关性搜索的神秘面纱,告诉大家如何将 Elasticsearch与 Solr这样的搜索引擎作为可编程的相关性框架,从而表达业务排名规则。从这本书中你可...

 

智能汽车安全攻防大揭秘

360独角兽安全团队(UnicornTeam) 李均 杨卿 等编著 (作者)

本书先针对汽车研发人员介绍了一些安全基础知识,如加密解密、安全认证、数字签名、常见攻击类型和手段等,然后针对安全研究人员介绍了一些智能汽车的工作原理,如汽车的内...

¥59.00
本书用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。

基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。

除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,本书既适合
零基础的人员入门学习、也适合相关科研人员作为研究参考。
零起点入门掌握AlphaGo的核心强化学习算法,原理分析+编程实践。从马尔科夫决策过程的动态规划方法一直讲到最前沿的深度强化学习,思路明确、清晰易懂!深度学习必备参考书!人工智大牛深度好评!
叙述简洁、直接、清晰,值得精读!
郭宪
南开大学计算机与控制工程学院博士后。2009 年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于 2016 年 1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数 10 篇。2016 年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。

方勇纯
南开大学教授、博士生导师、计算机与控制工程学院副院长、控制科学与工程一级学科学位分委员会主席,2017年度第七届吴文俊人工智能科学技术自然科学奖一等奖获得者。分别于1996年和1999年获得浙江大学本科和硕士学位,2002年获美国克莱姆森大学博士学位,2002年至2003年在美国康乃尔大学进行博士后研究。2003年至今任教于南开大学。2013年获得国家自然科学基金杰出青年基金资助。

目录

读者评论

相关博文

  • 强化学习是如何解决问题的?

    强化学习是如何解决问题的?

    管理员账号 2018-01-09

    什么是强化学习算法呢,它离我们有多远?2016年和2017年最具影响力的AlphaGo大胜世界围棋冠军李世石和柯洁事件,其核心算法就用到了强化学习算法。相信很多人想了解或者转行研究强化学习算法或多或少都跟这两场赛事有联系。如今,强化学习...

    管理员账号 2018-01-09
    402 0 0 0