游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
第四章_05_DQN
2219
第四章_04_Q-learning和Sarsa的对比
2245
第四章_03_Q-learning
2223
第四章_02_Sarsa
2186
第四章_01_状态-动作价值函数
2208
第三章_05_值迭代法
2214
第三章_04_策略迭代法
2194
第三章_03_状态价值的定义与思想
2226
第三章_01_三连棋游戏第一步走中间
2227
第二章_05_epsilon贪心策略
2224
第二章_03_探索利用平衡
2255
第二章_02_简单策略和贪婪策略
2244
第二章_01_MAB问题描述
2226
1.5强化学习的应用
106
1.4环境的确定性与随机性
122
1.3环境已知与未知
122
首页
<
22
23
24
25
26
27
28
>
尾页