机读格式显示(MARC)

000 01476nam0 2200265 450

001 0000465029

005 20171113193800.0

010 __ |a 978-7-111-56960-2 |d CNY69.00

100 __ |a 20171018d2017 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a y z 000yy

106 __ |a r

200 1_ |a 多智能体机器学习 |A Duo Zhi Neng Ti Ji Qi Xue Xi |9 duo zhi neng ti ji qi xue xi |e 强化学习方法 |f (加)霍华德 M. 施瓦兹(Howard M. Schwartz)著 |g 连晓峰，谭励等译

210 __ |a 北京 |c 机械工业出版社 |d 2017

215 __ |a 185页 |d 24cm

330 __ |a 本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章，首先介绍了几种常用的监督式学习方法，在此基础上，介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后，介绍了双人矩阵博弈问题、多人随机博弈学习问题，并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容，并提出LR-I滞后锚算法和指数移动平均Q学习算法等，并进行了分析比较。接下来，介绍了模糊系统和模糊学习，并通过仿真示例详细分析算法。最后，介绍了群智能学习进化以及性格特征概念和应用。

510 1_ |a Multi-agent machine learning |e a reinforcement approach |z eng

606 0_ |a 机器学习 |A Ji Qi Xue Xi

690 __ |a TP181 |v 5

701 _0 |c (加) |a 施瓦兹 |A Shi Wa Zi |9 shi wa zi |c (Schwartz, Howard M.) |4 著

702 _0 |a 连晓峰 |A Lian Xiao Feng |9 lian xiao feng |f (1977-) |4 译

702 _0 |c (壮) |a 谭励 |A Tan Li |9 tan li |c (女， |f 1980-) |4 译

801 _0 |a CN |b WXCSXY |c 20171113

905 __ |a WXCSXY |d TP181/33