강화 학습 (Reinforcement Learning)

목차

  1. RL 알고리즘
  2. 기타

RL 알고리즘

V3

Actor Critic 방법 (Actor Critic Method)

.

V3

Proximal 정책 최적화 (Proximal Policy Optimization)

.

V3

아타리 브레이크아웃을 위한 심층 Q-러닝 (Deep Q-Learning for Atari Breakout)

.

기타

V2

심층 결정론적 정책 그래디언트(DDPG) (Deep Deterministic Policy Gradient (DDPG))

.


Table of contents