应用Shannon 熵和其他熵指数来度量马尔可夫决策的复杂性1 将马尔可夫链的复杂性、不确定性和不可预 测性的度量扩展到马尔可夫决策, 提出一套基于信息理论的复杂性度量方法, 可用于随机和确定性策略下的完全观 测和不完全观测马尔可夫决策. 对有关数值进行仿真研究, 并给出了计算结果.
12,790
社区成员
12,324,614
社区内容
加载中
试试用AI创作助手写篇文章吧