2021-05-15から1日間の記事一覧

2021-05-15

rayで実装する分散強化学習 ④R2D2

Ape-XにRNNを導入することでatari環境において圧倒的SotAを叩き出した分散強化学習手法 R2D2（Recurrent Experience Replay in Distributed Reinforcement Learning）をtensorflow＋pythonの分散並列処理ライブラリrayで実装します Recurrent Experience Rep…

#強化学習 #tensorflow2 #R2D2

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2021-05-15から1日間の記事一覧

rayで実装する分散強化学習 ④R2D2