2021-02-09から1日間の記事一覧

2021-02-09

DQNの進化史 ③優先度付き経験再生, Multi-step learning, C51

Deep-Q-Network以降の深層強化学習（というか深層Q学習）の発展を、簡単な解説とtensorflow2での実装例と共に紹介していきます。今回は経験再生の改良である優先度付き経験再生（Prioritized experience replay）、方策勾配法ではよく使われるMulti-step lea…

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2021-02-09から1日間の記事一覧

DQNの進化史 ③優先度付き経験再生, Multi-step learning, C51