基于Python实现机器人自动走迷宫【100011016】( 四 )


图7 训练结果
图8 强化学习搜索gif地图(size5)
图9 训练结果
图10 强化学习搜索gif地图()
图11 训练结果
图12 强化学习搜索gif地图()
图13 训练结果
经过测试,强化学习搜索算法可以快速给出走出迷宫的路径并且随着训练轮次增加,成功率也逐渐上升 。当训练轮次足够时,最终后期准确率可以达到100% 。
4.3 DQN
在Q- 的基础上,使用神经网络来估计评估分数,用于决策之后的动作 。只需在Q-相应部分替换为神经网络的输出即可 。
测试结果如下:4.4 提交结果测试 4.4.1 基础搜索算法测试
图17 基础搜索算法路径
用时0秒
4.4.2 强化学习算法(初级)
图18 强化学习算法(初级)
用时0秒
4.4.3 强化学习算法(中级)
图19 强化学习算法(中级)
用时0秒
4.4.4 强化学习算法(高级)
图20 强化学习算法(高级)
用时0秒
4.4.5 DQN算法(初级)
图21 DQN算法(初级)
用时2秒
4.4.6 DQN算法(中级)
图22 DQN算法(中级)
用时3秒
4.4.7 DQN算法(高级)
图23 DQN算法(高级)
用时105秒
五 比较分析
比较基础搜索算法、强化学习搜索算法和DQN算法可以发现,在训练轮次提升到较大数字的时候,三算法速度均很快且有较高的准确率 。DQN算法耗费时间长,但是性能稳定 。
算法用时状态
深度优先+
0
到达终点
强化学习+size3
0
到达终点
强化学习+size5
0
到达终点
强化学习+
0
到达终点
DQN+size3
2
到达终点
DQN+size5
3
到达终点
DQN+
105
到达终点
六 心得与感想
通过本次实验,学习到了多种基础搜索算法的具体工作方式,并且在实践中实现了这些基础搜索算法;同时学习了强化学习搜索算法的工作原理和应用方式,让我对这些方法有了更加深刻的认识,也对各个环节有了更加深层次的理解,受益匪浅 。
?? 资源
大小: 5.28MB
?? 资源下载:
【基于Python实现机器人自动走迷宫【100011016】】注:如当前文章或代码侵犯了您的权益,请私信作者删除!