
会员
强化学习:原理与Python实现
更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结
书籍简介
全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理人工智能17.2万字
同类热门书
最新上架
- 会员本书讲解了C++语言基础知识,以及编程解题常用的方法和基础算法。每章都是由一个小故事来引出编程思维。本书也介绍了各种有趣的计算机知识,并涵盖了全国青少年软件编程等级考试(C语言)一级和二级考试的知识点。计算机13.4万字
- 会员本书内容分为差分进化算法(以下简称算法)的设计及应用。本书从差分进化算法基本原理、单目标差分进化算法、面向约束优化的差分进化算法、面向多目标差分进化算法、面向离散问题的差分进化算法等五个方面进行了介绍。对提出的10个算法进行了详细介绍和讨论,并给给出了实验(仿真)结果。计算机9.6万字
- 会员本书共11章,第1章讲解Python基础,第2章讲解数据处理与分析,第3章讲解科研绘图与学术图表绘制库,第4章讲解绘制单变量图形,第5章讲解绘制双变量图形,第6章讲解绘制多变量图形,第7章讲解绘制其他2D图形,第8章讲解绘制3D图形,第9章讲解地理信息可视化,第10章讲解数据学术报告、论文和出版,第11章讲解实战训练营。计算机9万字
- 会员本书主要以Java虚拟机的基本特性及运行原理为中心,分析了JVM的组成结构和底层实现,介绍了很多性能调优的方案和工具的使用方法。最后还扩展介绍了JMM内存模型的实现原理和Java编译器的优化机制。计算机12.1万字
- 会员本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。计算机11.2万字
- 会员本书是Java入门书籍,适合初学者使用。全书共13章,第1章主要讲解Java的特点与发展史、JDK的使用、Java程序的编写与运行机制、Java开发环境的搭建等;第2~6章主要讲解Java编程基础知识,包括Java基本语法、面向对象、JavaAPI和集合;第7~12章主要讲解Java进阶知识,包括I/O、多线程、网络编程、JDBC、GUI、Java反射机制;第13章带领读者开发一个综合项目——基计算机20万字
- 会员本书共15章,第1章讲解了ChatGPT的功能及在编程学习中的作用;第2章讲解了Python的语言特点及开发环境的搭建;第3-10章讲解了Python的语言基础,包括输入与输出、变量与类型、运算、控制流、函数、列表、字典、模块;第11-13章介绍了使用Python进行文件操作、网络爬虫的相关操作,以及面向对象程序设计;第14-15章介绍了ChatGPT工具在编程中的应用,包括利用它进行辅助开发和在计算机14.6万字
同类书籍最近更新
- 会员全书分为两大部分:理论篇和实践篇。前三章介绍了区块链技术的由来、核心思想及典型的应用场景。第4~5章重点介绍了区块链技术中大量出现的分布式系统技术和密码学安全技术。第6~8章分别介绍了区块链领域的三个典型开源项目:比特币、以太坊和超级账本。第9~11章以超级账本Fabric项目为例,具体讲解了安装部署、配置管理,以及使用FabricCA进行证书管理的实践经验。第12章重点剖析了超级账本Fabri程序设计17.4万字
- 会员本书内容分为差分进化算法(以下简称算法)的设计及应用。本书从差分进化算法基本原理、单目标差分进化算法、面向约束优化的差分进化算法、面向多目标差分进化算法、面向离散问题的差分进化算法等五个方面进行了介绍。对提出的10个算法进行了详细介绍和讨论,并给给出了实验(仿真)结果。程序设计9.6万字
- 会员本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。程序设计14.3万字
- 会员本书是与主教材《C语言程序设计》配套的实验与训练参考书,同时也是一本可以独立于主教材的实验练习与实训提高的实践教材。全书分为四部分。第一部分是与主教材内容对应的基础知识与习题练习,第二部分是上机实践与实验指导,第三部分是综合实训与技能提高,第四部分是计算机等级考试介绍。程序设计7.1万字
- 会员本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超程序设计13.2万字