游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
讲义3.1三连棋游戏第一步走中间
1928
讲义4.3Q-learning
1871
讲义6.5REINFORCE算法
1874
讲义6.3策略梯度定理的推导
1861
讲义7.3~7.4Actor-Critic的算法流程
1865
7.2 Actor-Critic的思想
776
7.1 策略梯度方法的缺点
783
7.3_7.4 Actor-Critic的算法流程
778
讲义7.2Actor-Critic的思想
1841
讲义2.4探索与利用的意义
138
讲义2.4探索与利用的意义
1846
讲义7.6DDPG的算法流程
1868
讲义7.5广义优势函数估计
1819
讲义6.4蒙特卡罗方法
1826
讲义6.2随机性策略梯度方法
1817
讲义6.1基于策略的思想
1830
首页
<
17
18
19
20
21
22
23
24
25
26
>
尾页