游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
第四章_05_DQN
2079
第四章_04_Q-learning和Sarsa的对比
2092
第四章_03_Q-learning
2082
第四章_02_Sarsa
2046
第四章_01_状态-动作价值函数
2065
第三章_05_值迭代法
2067
第三章_04_策略迭代法
2052
第三章_03_状态价值的定义与思想
2076
第三章_01_三连棋游戏第一步走中间
2077
第二章_05_epsilon贪心策略
2072
第二章_03_探索利用平衡
2093
第二章_02_简单策略和贪婪策略
2085
第二章_01_MAB问题描述
2077
1.5强化学习的应用
104
1.4环境的确定性与随机性
120
1.3环境已知与未知
120
首页
<
22
23
24
25
26
27
28
>
尾页