机读格式显示(MARC)

000 01247nam0 2200241 450

001 0000609462

010 __ |a 978-7-111-72891-7 |d CNY129.00

092 __ |a CN |b 人天1088-2874

100 __ |a 20230804d2023 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a y z 000yy

106 __ |a r

200 1_ |a 强化学习 |e 原理与Python实战 |f 肖智清著

210 __ |a 北京 |c 机械工业出版社 |d 2023.07

215 __ |a 504页 |d 24cm

225 2_ |a 智能系统与技术丛书

330 __ |a 本书介绍强化学习理论及其Python实现。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2-15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，针对深度强化学习算法还给出了基于TensorFlow 2和PyTorch 1的对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型，半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

333 __ |a 程序设计人员及相关读者

606 0_ |a 软件工具 |x 程序设计

690 __ |a TP311.561 |v 5

701 _0 |a 肖智清 |4 著

801 _0 |a CN |b 人天书店 |c 20230809