游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
强化学习-课程考核大纲202309
leixy
1517
强化学习-课程教学设计一体化实施方案202309
leixy
1514
强化学习-课程教学大纲202309
leixy
1516
7.6 DDPG的算法流程
leixy
1616
7.5 广义优势函数估计
leixy
1603
7.3_7.4 Actor-Critic的算法流程
leixy
1600
7.1 策略梯度方法的缺点
leixy
1599
6.5 REINFORCE算法
leixy
1602
6.4 蒙特卡罗方法
leixy
1599
6.3 策略梯度定理的推导
leixy
1571
6.2 随机性策略梯度方法
leixy
1567
6.1 基于策略的思想
leixy
1559
5.3 Sarsa和Q-learning在悬崖寻路问题上的实现
leixy
1554
5.2 Gym的使用方法
leixy
1550
4.4 Q-learning和Sarsa的对比
leixy
1555
4.3 Q-learning
leixy
1551
4.2 Sarsa
leixy
1539
4.1 状态-动作价值函数
leixy
1535
3.5 值迭代法
leixy
1534
3.4 策略迭代法
leixy
1530
1
2
3
4
5
>
尾页