强化学习;
基于多Agent强化学习的战时备件供应保障动态协调机制
来源:互联网摘选On-Policy Modeless Reinforcement Learning Algorithms for Average-Payoff MDPs
平均奖赏MDP的在策略无模型激励学习算法
来源:互联网摘选分别针对离散化的状态空间和连续状态空间的压缩问题,提出了基于信息熵的强化学习算法和基于自主生成神经网络函数逼近器的强化学习算法。
来源:互联网摘选传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题。
来源:互联网摘选针对这种导师信号难以获取、模糊规则难以制定的复杂优化控制问题,本文提出了一种基于混合式策略梯度增强学习PG-SVM的多轮协调控制方法。
来源:互联网摘选分析了折扣激励学习存在的问题,对MDPs的SARSA(λ)算法进行了折扣的比较实验分析,讨论了平均奖赏常量对无折扣SARSA(()算法的影响。
来源:互联网摘选本文分析了几种强化学习方法,包括基于值函数(Value-Based)近似方法、策略梯度方法(Policy gradient)、以及Actor-Critic方法等。
来源:互联网摘选针对月球车运动控制中的多轮协调问题,提出了一种基于混合策略梯度增强学习的自适应控制方法。
来源:互联网摘选分层强化学习(HRL)是为解决强化学习的维数灾问题而提出的,并取得了显著进展。
来源:互联网摘选Agent reinforcement learning is an important branch of machine learning.
Agent强化学习是机器学习的一个重要分支。
来源:互联网摘选针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法。
来源:互联网摘选The coordination behavior level used reinforcement learning to strengthen the robots' intelligence.
协调行为层应用强化学习法增强了机器人群体的智能性;
来源:互联网摘选The Study of Multi-Agent Reinforcement Learning Methods for Cooperative Team
多Agent协作团队的强化学习方法研究
来源:互联网摘选The concepts of Markov decision process and reinforcement learning are introduced firstly.
论文首先介绍了马尔可夫决策过程的基本概念和再励学习的框架。
来源:互联网摘选本文分别针对具有离散行为空间和连续行为空间的马氏决策问题,提出了两种模糊策略梯度增强学习方法(Fuzzy Policy Gradient:FPG)。
来源:互联网摘选应用多代理马尔可夫决策过程,建立了一种新的多管理者网络故障监控机制,并给出了该机制下基于强化学习的轮询策略。
来源:互联网摘选Research and Application on Reinforcement Learning and Communication Technology in Agent
Agent的强化学习与通信技术研究及应用
来源:互联网摘选提出了一种基于分布式强化学习的多Agent协调模型并给出了相应的算法。
来源:互联网摘选Comparative Analysis of Single-Agent Reinforcement Learning and Multi-Agent Reinforcement Learning
单agent强化学习与多agent强化学习比较研究
来源:互联网摘选本文的创新点和研究成果主要包括:1、在策略梯度增强学习理论框架的研究中,证明了现有策略梯度增强学习算法的梯度估计公式都符合统一的形式。
来源:互联网摘选A Multi-agent Cooperative Reinforcement Learning Algorithm Based on Team Markov Game
一种基于团队马尔可夫博弈的多agent协同强化学习算法
来源:互联网摘选S(λ): A reinforcement learning algorithm based on average-payoff MDPs
S(λ):一个基于平均奖赏MDPs的激励学习算法
来源:互联网摘选基于强化学习原理提出了整体与局部混合防御模型,通过智能体之间的角色转换提高防守能力,与传统相比更有优势。
来源:互联网摘选Application and development of reinforcement learning theory in power systems
强化学习理论在电力系统中的应用及展望
来源:互联网摘选
英语网 · 双语娱乐资讯

英语网 · 商务英语
英语网 · 双语娱乐资讯
英语网 · 双语娱乐资讯

英语网 · 英语口语

英语网 · 初中英语作文