游客
登录
我的空间
使用说明下载
首页
1.3环境已知与未知
1.3环境已知与未知
引用
分享
手机看
扫码继续查看
leixy
2022-6-16 上传
播放量 717
被收录到
全部
详细信息
所属分类:
江开本科 - 人工智能(本科)
知识体系:
工学
主讲老师:
余欣航
版权归属:
江苏开放大学版权
关键词
强化学习
马尔科夫决策
贪心策略
最优控制
Q-learning
策略梯度
Actor-Critic