首站-论文投稿智能助手
典型文献
Polish空间上的折扣马氏过程量子化策略的渐近优化
文献摘要:
该文研究了 Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
文献关键词:
连续时间马尔可夫决策过程;依赖状态折扣因子;折扣准则;量子化平稳策略;渐近最优性
作者姓名:
吴晓;孔荫莹;郭圳滨
作者机构:
肇庆学院数学与统计学院 广东肇庆526061;广东财经大学智能财会管理学院 广州510320;广发证券股份有限公司发展研究中心 上海200120
文献出处:
引用格式:
[1]吴晓;孔荫莹;郭圳滨-.Polish空间上的折扣马氏过程量子化策略的渐近优化)[J].数学物理学报,2022(02):594-604
A类:
连续时间马尔可夫决策过程,CTMDPs,量子化平稳策略,依赖状态折扣因子,折扣准则
B类:
Polish,渐近最优性,DOE,解的存在性,唯一性,离散化,一列,个例,例子,渐近逼近
AB值:
0.147959
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。