首站-论文投稿智能助手
典型文献
一种适用于非稳态浅海信道的强化学习自适应调制方案
文献摘要:
在时-空-频随机变化的浅海水声信道条件下,采用单一调制方式的水声通信系统难以权衡稳定性和通信速率,无法适应海洋信息可靠、高效传输的应用需求,因此自适应调制成为提高水声通信环境适应性的重要技术手段之一.但是,由于水声信道下传输时延增长,传统基于阈值判断和反馈的自适应调制方案存在反馈信息过时的问题,导致系统性能下降.本文将强化学习中的重复更新Q学习(RUQL)算法引入浅海信道自适应调制,用信噪比和多普勒频偏表征信道的状态变化,通过与环境交互学习信道的变化,经过多次迭代学习最优策略,实现多通信制式的自优化调整.实验结果表明,相对传统的基于门限阈值判断调整调制参数的自适应调制方案,本文设计的强化学习自适应浅海水声调制方案在系统吞吐量和误码率上均有明显提升,且相较于传统的Q学习算法有更快的收敛速度.
文献关键词:
重复更新Q学习;自适应调制;浅海信道;非稳态
作者姓名:
邱逸凡;张小康;陈东升;童峰
作者机构:
厦门大学水声通信与海洋信息技术教育部重点实验室,福建 厦门 361005;厦门大学海洋与地球学院,福建 厦门 361102;厦门大学深圳研究院,广东 深圳 518000
引用格式:
[1]邱逸凡;张小康;陈东升;童峰-.一种适用于非稳态浅海信道的强化学习自适应调制方案)[J].厦门大学学报(自然科学版),2022(06):1072-1081
A类:
RUQL
B类:
非稳态,浅海信道,强化学习,自适应调制,机变,浅海水声信道,调制方式,水声通信,通信系统,通信速率,海洋信息,高效传输,应用需求,通信环境,环境适应性,下传,传输时延,阈值判断,反馈信息,导致系统,系统性能,性能下降,信道自适应,多普勒频偏,状态变化,交互学习,多次迭代,迭代学习,最优策略,多通,制式,自优化,优化调整,门限,声调,系统吞吐量,误码率,收敛速度
AB值:
0.343232
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。