游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
案例 Q-learning解决悬崖寻路
leixy
1971
3 策略梯度关键知识点
leixy
1981
2 Q-learning和Sarsa关键知识点
leixy
1969
第七章_11_DDPG的算法流程
leixy
2161
第七章_05_广义优势函数估计
leixy
2104
第七章_04_Actor-Critic with Baseline
leixy
2102
第七章_03_Actor-Critic的算法流程
leixy
2151
第七章_01_策略梯度方法的缺点
leixy
2104
第六章_05_REINFORCE算法
leixy
2101
第六章_04_蒙特卡罗方法
leixy
2091
第六章_03_策略梯度定理的推导(下)
leixy
2085
第六章_03_策略梯度定理的推导(上)
leixy
2081
第六章_02_随机性策略梯度方法
leixy
2079
第六章_01_基于策略的思想
leixy
2070
第五章_02_Gym的使用方法
leixy
2098
第五章_01_Gym简介和环境加载
leixy
2068
第四章_05_DQN
leixy
2092
第四章_04_Q-learning和Sarsa的对比
leixy
2106
第四章_03_Q-learning
leixy
2096
第四章_02_Sarsa
leixy
2060
首页
<
2
3
4
5
6
7
8
>
尾页