强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字

同类热门书

最新上架

  • 这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、
    于君泽 曹洪伟 李伟山 秦金卫 陈龙泉计算机23.3万字
  • 会员
    本书讲解了C++语言基础知识,以及编程解题常用的方法和基础算法。每章都是由一个小故事来引出编程思维。本书也介绍了各种有趣的计算机知识,并涵盖了全国青少年软件编程等级考试(C语言)一级和二级考试的知识点。
    王桂平 周祖松 穆云波 葛昌威编著计算机13.4万字
  • 会员
    本书内容分为差分进化算法(以下简称算法)的设计及应用。本书从差分进化算法基本原理、单目标差分进化算法、面向约束优化的差分进化算法、面向多目标差分进化算法、面向离散问题的差分进化算法等五个方面进行了介绍。对提出的10个算法进行了详细介绍和讨论,并给给出了实验(仿真)结果。
    董明刚 王宁 艾兵等计算机9.6万字
  • 会员
    本书共11章,第1章讲解Python基础,第2章讲解数据处理与分析,第3章讲解科研绘图与学术图表绘制库,第4章讲解绘制单变量图形,第5章讲解绘制双变量图形,第6章讲解绘制多变量图形,第7章讲解绘制其他2D图形,第8章讲解绘制3D图形,第9章讲解地理信息可视化,第10章讲解数据学术报告、论文和出版,第11章讲解实战训练营。
    关东升编著计算机9万字
  • 会员
    本书主要以Java虚拟机的基本特性及运行原理为中心,分析了JVM的组成结构和底层实现,介绍了很多性能调优的方案和工具的使用方法。最后还扩展介绍了JMM内存模型的实现原理和Java编译器的优化机制。
    李博计算机12.1万字
  • 会员
    在加密、科学建模、制造物流、金融建模和人工智能等领域,量子计算可以极大提升解决问题的效率。量子系统正变得越来越强大,逐渐可用于生产环境。本书介绍了量子计算的思路与应用,在简要说明与量子相关的科学原理之后,指导读者实现量子计算算法。本书将带领读者使用基于Java的Strange量子模拟器编写量子程序,并探索量子位和量子逻辑门。在介绍标准Java和构建工具创建量子算法的同时,本书还引入了有趣的示例和深
    (比)约翰·沃斯计算机10.5万字
  • 会员
    本书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。
    王振丽编著计算机11.2万字
  • 会员
    本书是Java入门书籍,适合初学者使用。全书共13章,第1章主要讲解Java的特点与发展史、JDK的使用、Java程序的编写与运行机制、Java开发环境的搭建等;第2~6章主要讲解Java编程基础知识,包括Java基本语法、面向对象、JavaAPI和集合;第7~12章主要讲解Java进阶知识,包括I/O、多线程、网络编程、JDBC、GUI、Java反射机制;第13章带领读者开发一个综合项目——基
    黑马程序员编著计算机20万字
  • 会员
    本书共15章,第1章讲解了ChatGPT的功能及在编程学习中的作用;第2章讲解了Python的语言特点及开发环境的搭建;第3-10章讲解了Python的语言基础,包括输入与输出、变量与类型、运算、控制流、函数、列表、字典、模块;第11-13章介绍了使用Python进行文件操作、网络爬虫的相关操作,以及面向对象程序设计;第14-15章介绍了ChatGPT工具在编程中的应用,包括利用它进行辅助开发和在
    袁昕编著计算机14.6万字

同类书籍最近更新

  • 会员
    全书分为两大部分:理论篇和实践篇。前三章介绍了区块链技术的由来、核心思想及典型的应用场景。第4~5章重点介绍了区块链技术中大量出现的分布式系统技术和密码学安全技术。第6~8章分别介绍了区块链领域的三个典型开源项目:比特币、以太坊和超级账本。第9~11章以超级账本Fabric项目为例,具体讲解了安装部署、配置管理,以及使用FabricCA进行证书管理的实践经验。第12章重点剖析了超级账本Fabri
    杨保华 陈昌程序设计17.4万字
  • 会员
    本书内容分为差分进化算法(以下简称算法)的设计及应用。本书从差分进化算法基本原理、单目标差分进化算法、面向约束优化的差分进化算法、面向多目标差分进化算法、面向离散问题的差分进化算法等五个方面进行了介绍。对提出的10个算法进行了详细介绍和讨论,并给给出了实验(仿真)结果。
    董明刚 王宁 艾兵等程序设计9.6万字
  • 会员
    本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。
    张大为 刘德山 崔晓松 张也非主编程序设计14.3万字
  • 会员
    本书是与主教材《C语言程序设计》配套的实验与训练参考书,同时也是一本可以独立于主教材的实验练习与实训提高的实践教材。全书分为四部分。第一部分是与主教材内容对应的基础知识与习题练习,第二部分是上机实践与实验指导,第三部分是综合实训与技能提高,第四部分是计算机等级考试介绍。
    孟东霞主编程序设计7.1万字
  • 会员
    本书详细介绍C语言及其程序设计方法。全书共12章,主要内容包括:概述;数据类型、运算符及表达式;顺序结构程序设计;选择结构程序设计;循环结构程序设计;数组;指针;函数和变量的存储类型;结构体、公用体和枚举类型;编译预处理;位运算;文件。
    杨崇艳主编程序设计13.7万字
  • 会员
    本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超
    聂常红编著程序设计13.2万字