원본 링크 : https://keras.io/examples/rl/
최종 수정일 : 2024-04-02

강화 학습 (Reinforcement Learning)

목차

RL 알고리즘
기타

RL 알고리즘

V3

Actor Critic 방법 (Actor Critic Method)

.

V3

Proximal 정책 최적화 (Proximal Policy Optimization)

.

V3

아타리 브레이크아웃을 위한 심층 Q-러닝 (Deep Q-Learning for Atari Breakout)

.

기타

V2

심층 결정론적 정책 그래디언트(DDPG) (Deep Deterministic Policy Gradient (DDPG))

.

Table of contents