我一直在阅读有关分层强化学习(HRL)及其应用的文章。在此可以找到有关该主题的书面文献综述。但是,我想知道是否曾经在单个机器人上实施HRL系统的研究?本文似乎暗示了它的含义,即它所建模的交付任务“在计算和实验环境中都常用于HRL”。但是,对于这种实际实验设置,我的Google学术搜索没有取得任何成果。对于在机器人中发现基于模型或无模型的分层强化学习的实现将不胜感激。
#1 楼
HRL已在多种情况下体现在机器人中。
在伸手可及的货架机器人中。
在机器人中学习如何站立up。
在机器人导航中。
但是,HRL在每种情况下的应用方式各不相同。第一种方法使用HRL来操纵动态运动基元,而第二种方法则更侧重于学习状态空间值。
评论
听到这是使用真正的机器人完成的,我会非常感动,因为您需要对实际的钢筋进行大量的试验-需要大量时间和机器人维护才能完成。南加州大学进行了一项研究。可以在此链接中找到详细信息perso.ensta-paristech.fr/~stulp/publications/pdfs / ...