游客
登录
我的空间
使用说明下载
leixy
3
课程
|
444
资源
资源
课程
全部
视频
音频
图片
文档
PPT
其它
第四章_05_DQN
1893
第四章_04_Q-learning和Sarsa的对比
1907
第四章_03_Q-learning
1891
第四章_02_Sarsa
1860
第四章_01_状态-动作价值函数
1874
第三章_05_值迭代法
1880
第三章_04_策略迭代法
1865
第三章_03_状态价值的定义与思想
1887
第三章_01_三连棋游戏第一步走中间
1882
第二章_05_epsilon贪心策略
1882
第二章_03_探索利用平衡
1907
第二章_02_简单策略和贪婪策略
1894
第二章_01_MAB问题描述
1887
1.5强化学习的应用
103
1.4环境的确定性与随机性
118
1.3环境已知与未知
119
首页
<
22
23
24
25
26
27
28
>
尾页