2021-03-02から1日間の記事一覧

2021-03-02

rayで実装する分散強化学習 ③Ape-X DQN

深層強化学習における超大規模分散並列化の有用性を示したApeX-DQN（Distributed Prioritized Experience Replay）をtensorflow2とrayで実装します。手法の構成要素自体はRainbowとだいたい同じであるため、本記事の焦点は分散並列学習の実装です。はじめに…

#強化学習 #tensorflow2 #ray

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2021-03-02から1日間の記事一覧

rayで実装する分散強化学習 ③Ape-X DQN