游客
登录
我的空间
使用说明下载
分类:
全部
江开本科
江开专科
江苏开放大学
江苏城市职业学院
江苏老年开放大学
国家开放大学
老年学历教育
素质教育
版权资源库
社会教育
江苏科协
名师课堂
政策法规
知识体系
综合
江苏学习在线
开放大学栏目
人群:
幼儿
中老年
妇女
大众
青少年
知识体系:
信息技术
经济学
法学
教育学
文学
历史学
工学
医学
管理学
艺术学
军事学
哲学
农学
更多筛选
课程
资源
全部
视频
音频
图片
文档
PPT
其它
最新
最热
最赞
5.4 Tensorflow复习
leixy
706
4.1 状态-动作价值函数
leixy
714
4.2 Sarsa
leixy
717
4 Q-learning
leixy
706
2.4 探索与利用的意义
leixy
713
2.2 简单策略和贪婪策略
leixy
718
2.3 探索利用平衡
leixy
711
2.5 epsilon贪心策略
leixy
717
2.1 MAB问题描述
leixy
721
2 多臂老虎机
leixy
705
1.2马尔可夫决策过程
leixy
721
1.3环境已知与未知
leixy
728
1.4环境的确定性与随机性
leixy
722
1.5强化学习的应用
leixy
719
1.1马尔可夫过程
leixy
723
案例 多臂老虎机问题策略的实现
leixy
2071
案例 利用策略迭代和值迭代求解迷宫寻宝问题
leixy
2067
案例 迷宫寻宝
leixy
2069
案例 REINFORCE算法求解小车爬山游戏
leixy
2076
1 强化学习关键概念
leixy
2069
首页
<
1
2
3
4
5
6
7
8
>
尾页