Multi-task Deep Reinforcement Learning with PopArt
부제: impala에 popart를 싸서 드셔보세요
More …혹시 몰라 정리하는 Bachelor논문
尹授老, 遠藤靖典, 木下尚彦, “許容範囲付きデータに対する多項式回帰モデル”, 筑波大学, 2016
More …multiprocessing에서 gym이 오작동하는 경우
tl;dr
- gym>=0.10.6이면 상관x
- multiprocessing으로 학습을 진행시키는 경우 주의
IMPALA - Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures
IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures https://arxiv.org/abs/1802.01561
More …