游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
2.5 epsilon贪心策略
1405
2.4 探索与利用的意义
1406
2.3 探索利用平衡
1404
2.2 简单策略和贪婪策略
1401
1.5强化学习的应用
1405
1.4环境的确定性与随机性
1406
1.3环境已知与未知
1414
1.1马尔可夫过程
1404
1-1机器人概念及发展历史--2023年5月5日
144
1-1机器人概念及发展历史--2023年5月5日
1402
机器人系统设计导论-学员网上学习行为规范
1420
机器人系统设计导论-课程学习方法与策略
1404
第四单元 QLearning
1604
第七单元 Actor-Critic-new
1597
Deterministic Policy Gradient (V1)
125
Off-policy Actor-Critic(V1)
127
首页
<
11
12
13
14
15
16
17
18
19
20
>
尾页