[返回課程頁面]
第16講 Reinforcement Learning/Q-learning
課程影音
L16F
L16_A
Introduction
L16_B
Markov Decision Process (MDP)
L16_C
Value Iteration
L16_D
Policy Iteration
L16_E
Reinforcement Learning
L16_F
Model-Free RL based on MC Estimation
L16_G
Temporal Difference Learning SARSA
L16_H
Exploration Strategies
L16_I
Q-Learning
L16_J
SARSA vs. Q-Learning
資料下載
暫無資料
相關連結
使用說明
高畫質
標準畫質
普通畫質
離線觀看
講義
投影片
試題
作業
教科書
線上觀看 | |
相關教材 | |