游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
第四章_05_DQN
1981
第四章_04_Q-learning和Sarsa的对比
1994
第四章_03_Q-learning
1981
第四章_02_Sarsa
1948
第四章_01_状态-动作价值函数
1966
第三章_05_值迭代法
1969
第三章_04_策略迭代法
1956
第三章_03_状态价值的定义与思想
1978
第三章_01_三连棋游戏第一步走中间
1975
第二章_05_epsilon贪心策略
1974
第二章_03_探索利用平衡
1997
第二章_02_简单策略和贪婪策略
1986
第二章_01_MAB问题描述
1979
1.5强化学习的应用
104
1.4环境的确定性与随机性
119
1.3环境已知与未知
120
首页
<
22
23
24
25
26
27
28
>
尾页