2020-12-28から1日間の記事一覧

2020-12-28

rayで実装する分散強化学習 ①A3C（非同期Advantage Actor-Critic）

Pythonの分散並列処理ライブラリであるRayとTensorflow2を使って分散強化学習の主要な手法を実装していきます。まずは分散強化学習の草分け的な手法であるA3C (Asynchronous advantage actor-critic、非同期アドバンテージアクタークリティック) です。は…

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2020-12-28から1日間の記事一覧

rayで実装する分散強化学習 ①A3C（非同期Advantage Actor-Critic）