游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
1 强化学习关键概念
1750
案例 Q-learning解决悬崖寻路
1775
3 策略梯度关键知识点
1786
2 Q-learning和Sarsa关键知识点
1774
第七章_11_DDPG的算法流程
1960
第七章_05_广义优势函数估计
1904
第七章_04_Actor-Critic with Baseline
1900
第七章_01_策略梯度方法的缺点
1904
第六章_05_REINFORCE算法
1901
第六章_04_蒙特卡罗方法
1889
第六章_03_策略梯度定理的推导(下)
1885
第六章_03_策略梯度定理的推导(上)
1882
第六章_02_随机性策略梯度方法
1882
第六章_01_基于策略的思想
1874
第五章_02_Gym的使用方法
1891
第五章_01_Gym简介和环境加载
1868
首页
<
21
22
23
24
25
26
27
28
>
尾页