在现实世界中安全地学习运动技能(安全运动的方法和技能)
该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。
只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。
该框架由两个政策组成。“安全恢复策略”将机器人从接近不安全的状态中恢复,“学习者策略”执行所需的控制任务。该算法的有效性在三个运动任务上得到证明。对于高效的步态和走秀任务,实现了没有跌倒且无需手动重置的策略。
只用四次跌倒训练了一条两条腿的平衡任务。该论文表明,在现实世界中自主安全地学习腿部运动技能是可能的。