游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
测试强化学习-7.2视频
leixy
2269
测试强化学习5.3视频
leixy
2281
2.6 案例训练 多臂老虎机问题策略实现
leixy
1008
案例 AC实现小车倒立摆游戏
leixy
2257
6.5 REINFORCE算法
leixy
860
4.4 Q-learning和Sarsa的对比
leixy
862
4.5 DQN
leixy
787
4.3 Q-learning
leixy
856
讲义3.4策略迭代法
leixy
2122
讲义7.1策略梯度方法的缺点
leixy
2156
讲义1.5强化学习的应用
leixy
2126
讲义1.3环境已知与未知
leixy
2120
讲义2.2简单策略和贪婪策略
leixy
2109
讲义2.1MAB问题描述
leixy
2131
讲义3.2三连棋游戏第一步走角落
leixy
2100
讲义3.1三连棋游戏第一步走中间
leixy
2128
讲义4.3Q-learning
leixy
2065
讲义6.5REINFORCE算法
leixy
2071
讲义6.3策略梯度定理的推导
leixy
2055
讲义7.3~7.4Actor-Critic的算法流程
leixy
2062
首页
<
1
2
3
4
5
6
7
>
尾页