
会员
Python强化学习:算法、核心技术与行业应用
更新时间:2024-04-15 11:58:27 最新章节:文后
书籍简介
本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分:第一部分涵盖强化学习的必要背景,包括定义、数学基础和强化学习解决方案的概述;第二部分深入介绍最先进的强化学习算法(规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等),包括每种算法的优缺点;第三部分介绍强化学习中的高级技术,包括机器教学、泛化和域随机化、元强化学习等主题,还涵盖强化学习中有助于改进模型的各种高级主题;第四部分讲解强化学习的各种应用,例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等,并讨论强化学习领域的一些挑战及未来方向。学完本书,你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。
品牌:机械工业出版社
译者:朱小虎等
上架时间:2023-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
(美)埃内斯·比尔金
最新上架
- 会员本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字
- 会员本书将带你深入探索AI“神器”——DeepSeek的无限潜能,带你从零开始,轻松掌握AI的核心应用。通过学习本书,你将轻松上手DeepSeek,开启智能生活新篇章;通过学习本书,你将学会用DeepSeek大幅提升工作效率;通过学习本书,你将学会如何让DeepSeek成为你的职场超级助手;通过学习本书,你将学会如何利用DeepSeek激发自己的创作灵感,打造爆款内容和个人品牌;通过学习本书,你将学会计算机7.2万字
- 会员在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次计算机8.7万字
- 会员本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。计算机8.8万字
- 会员本书结合作者10多年写作经验,基于AI应用ChatGPT、文心一言、智谱清言、讯飞星火、通义千问、Kimi等,详细介绍了使用AI写作的流程、方法和技巧,旨在帮助想要通过内容输出加速个人发展的读者,快速掌握AI自媒体写作的方法和技巧。本书分为11章,涵盖AI自媒体写作概述、AI提示词、AI起标题、AI做选题、AI角色化写作、AI套路化写作、AI仿写、AI模块化写作、AI改写、AI润色、AI智能体写作计算机9.2万字
同类书籍最近更新
- 会员本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技人工智能5.5万字
- 会员本书提供了基于智造观的技术架构:提出实现智能制造的四部曲,即流程精益化、适应自动化、系统数字化以及信息云端化;分析产品生命周期管理导向的生产制造模式及实现方法,包括大数据的应用、互联网自动控制网络的应用、数字化与信息技术的深度融合。人工智能12.2万字
- 会员本书的副书名指出知识工程2.0是智能制造时代的研发智慧,书中的讨论对象和举例均以研发企业或研发过程为背景。但这只是因为研发过程是知识最密集、产出最丰富和应用最深入的过程,并不代表本书所提的方法不适用于非研发型企业。非研发型企业或非研发过程的知识工程方法是本书所提方法的子集,大部分方法进行适应性改造,即可适用于这些企业或过程。人工智能13.9万字