机读格式显示(MARC)
- 000 01201oam2 2200289 450
- 010 __ |a 978-7-03-040640-8 |d CNY89.00
- 100 __ |a 20140727d2014 em y0chiy50 ea
- 200 1_ |a 强化学习原理及其应用 |A qiang hua xue xi yuan li ji qi ying yong |f 王雪松,朱美强,程玉虎著
- 210 __ |a 北京 |c 科学出版社 |d 2014
- 215 __ |a 12,253页 |c 图 |d 24cm
- 225 2_ |a 智能科学技术著作丛书 |A Zhi Neng Ke Xue Ji Shu Zhu Zuo Cong Shu
- 330 __ |a 本书分别从值函数逼近、直接策略搜索和基于谱方法的学习三个方面来阐述强化学习的理论、方法及其应用。全书分为13章,其中第1-2章为强化学习概述和相关基础理论;第3-5章为基于值函数估计的强化学习方法及其应用;第6-9章为直接策略搜索强化学习方法及其应用;第10-13章是对基于谱方法的强化学习进行研究。
- 461 _0 |1 2001 |a 智能科学技术著作丛书
- 606 0_ |a 学习方法 |A Xue Xi Fang Fa |x 研究
- 606 0_ |a 学习方法 |A Xue Xi Fang Fa
- 701 _0 |a 王雪松 |A wang xue song |c (女, |f 1974~) |4 著
- 701 _0 |a 朱美强 |A zhu mei qiang |4 著
- 701 _0 |a 程玉虎 |A cheng yu hu |f (1973~) |4 著
- 801 _0 |a CN |b WXCSXY |c 20191210
- 905 __ |a WXCSXY |d G791/84