游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
讲义2.5ε贪心策略
leixy
1982
讲义2.4探索与利用的意义
leixy
141
讲义2.3探索与利用平衡
leixy
1954
讲义1.4环境的确定性与随机性
leixy
1960
讲义1.2马尔可夫决策过程
leixy
1974
讲义1.1马尔可夫过程
leixy
1997
5.3 Sarsa和Q-learning在悬崖寻路问题上的实现
leixy
783
6.4 蒙特卡罗方法
leixy
786
7.6 DDPG的算法流程
leixy
799
7.5 广义优势函数估计
leixy
755
7.7 案例训练:利用A2C算法求解钟摆平衡问题
leixy
798
7 Actor-Critic
leixy
751
6.3 策略梯度定理的推导
leixy
758
6.6 案例训练 利用策略梯度方法求解小车上山问题
leixy
748
6.2 随机性策略梯度方法
leixy
725
6.1 基于策略的思想
leixy
723
6 策略梯度
leixy
715
5.1 Gym简介和环境加载
leixy
721
5.2 Gym的使用方法
leixy
714
5 强化学习的实验环境与工具
leixy
703
首页
<
1
2
3
4
5
6
7
8
>
尾页