江苏开放大学•点石网 - 点石网|江苏终身学习资源库

更多筛选

全部视频音频图片文档 PPT 其它

最新最热最赞

测试强化学习-7.2视频

测试强化学习5.3视频

2.6 案例训练多臂老虎机问题策略实现

案例 AC实现小车倒立摆游戏

6.5 REINFORCE算法

4.4 Q-learning和Sarsa的对比

讲义3.4策略迭代法

讲义7.1策略梯度方法的缺点

讲义1.5强化学习的应用

讲义1.3环境已知与未知

讲义2.2简单策略和贪婪策略

讲义2.1MAB问题描述

讲义3.2三连棋游戏第一步走角落

讲义3.1三连棋游戏第一步走中间

讲义4.3Q-learning

讲义6.5REINFORCE算法

讲义6.3策略梯度定理的推导

讲义7.3~7.4Actor-Critic的算法流程

首页
<
1
2
3
4
5
6
7
>
尾页