图书介绍
实用马尔可夫决策过程pdf电子书版本下载

- 刘克编著 著
- 出版社: 北京:清华大学出版社
- ISBN:730209506X
- 出版时间:2004
- 标注页数:185页
- 文件大小:7MB
- 文件页数:195页
- 主题词:马尔可夫决策-研究
PDF下载
下载说明
实用马尔可夫决策过程PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 引论 1
1.1 序列决策模型 1
1.2 马氏决策过程的例子 3
1.3 马氏决策过程的定义与记号 7
1.4 马氏决策过程的起源和发展 13
第2章 有限阶段模型 16
2.1 最优准则 16
2.2 有限阶段的策略迭代和最优方程 17
2.3 最优策略的存在性和算法 19
2.4 两个例子 22
2.5 单调策略的最优性 26
3.1 最优准则 31
第3章 无限阶段折扣模型 31
3.2 最优方程 32
3.3 最优策略的存在性 34
3.4 策略迭代算法 37
3.5 值迭代算法 40
3.6 改进的策略迭代算法 45
3.7 线性规划算法 47
3.8 可数状态与行动的模型 49
3.9 最优单调策略 60
3.10 最优策略的结构 62
第4章 无限阶段平均模型 64
4.1 最优准则 64
4.2 最优平稳策略的存在性 66
4.3 平稳策略的一些特征 68
4.4 最优方程与策略迭代算法 75
4.5 单链时的情形 79
4.6 多链时的情形 100
第5章 权重准则模型与概率准则模型 106
5.1 折扣权重模型 106
5.2 折扣与平均权重模型 113
5.3 MDP的百分比与目标水平 116
5.4 风险概率准则模型 121
第6章 连续时间与半马氏模型 131
6.1 连续时间折扣MDP 131
6.2 连续时间平均MDP 138
6.3 折扣半马氏模型 141
6.4 平均半马氏模型 145
6.5 服务率受控的一个排队模型 148
第7章 空集装箱调配问题 150
7.1 单港口的问题与建模 150
7.2 无限阶段折扣准则 154
7.3 无限阶段平均准则 156
7.4 数值例子 158
7.5 多港口空集装箱的调配问题 159
第8章 人力资源模型 163
8.1 问题 163
8.2 数学模型 165
8.3 相关参数分析 169
8.4 数例 171
参考文献 173
索引 183