游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
1 强化学习关键概念
1834
案例 Q-learning解决悬崖寻路
1860
3 策略梯度关键知识点
1870
2 Q-learning和Sarsa关键知识点
1859
第七章_11_DDPG的算法流程
2043
第七章_05_广义优势函数估计
1989
第七章_04_Actor-Critic with Baseline
1985
第七章_01_策略梯度方法的缺点
1989
第六章_05_REINFORCE算法
1987
第六章_04_蒙特卡罗方法
1975
第六章_03_策略梯度定理的推导(下)
1971
第六章_03_策略梯度定理的推导(上)
1967
第六章_02_随机性策略梯度方法
1967
第六章_01_基于策略的思想
1960
第五章_02_Gym的使用方法
1981
第五章_01_Gym简介和环境加载
1956
首页
<
21
22
23
24
25
26
27
28
>
尾页