- 원본 링크 : https://keras.io/examples/rl/
- 최종 수정일 : 2024-04-02
강화 학습 (Reinforcement Learning)
목차
RL 알고리즘
V3
Actor Critic 방법 (Actor Critic Method)
.
V3
Proximal 정책 최적화 (Proximal Policy Optimization)
.
V3
아타리 브레이크아웃을 위한 심층 Q-러닝 (Deep Q-Learning for Atari Breakout)
.
기타
V2
심층 결정론적 정책 그래디언트(DDPG) (Deep Deterministic Policy Gradient (DDPG))
.