游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
版权资源库
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
7.2 Actor-Critic的思想
leixy
783
7.1 策略梯度方法的缺点
leixy
792
7.3_7.4 Actor-Critic的算法流程
leixy
786
讲义7.2Actor-Critic的思想
leixy
2169
讲义2.4探索与利用的意义
leixy
2177
讲义7.6DDPG的算法流程
leixy
2197
讲义7.5广义优势函数估计
leixy
2148
讲义6.4蒙特卡罗方法
leixy
2159
讲义6.2随机性策略梯度方法
leixy
2141
讲义6.1基于策略的思想
leixy
2158
讲义5.3Sarsa和Q-learning在悬崖寻路问题上的实现
leixy
2150
讲义5.2Gym的使用方法
leixy
2149
讲义5.1Gym简介和环境加载
leixy
2160
讲义4.5DQN
leixy
2151
讲义4.4Q-learning和Sarsa的对比
leixy
2141
讲义4.2Sarsa
leixy
2134
讲义4.1状态-动作价值函数
leixy
2158
讲义3.5值迭代法
leixy
2122
讲义3.3状态价值的定义与思想
leixy
2127
讲义2.6案例训练 多臂老虎机问题策略实现
leixy
2113
首页
<
1
2
3
4
5
6
7
8
>
尾页