2020-12-26から1日間の記事一覧

2020-12-26

Soft Actor-Critic (SAC) ②tensorflow2による実装

連続値制御で大人気の強化学習手法であるSoft-Aactor-Criticのtensorflow2実装を解説します。対象タスクはPendulum-v0とBipedalWalker-v3。前記事： horomary.hatenablog.com ここまでの概要 Soft-Q関数について soft-Q関数の更新ソフトターゲット更新方…

#強化学習 #tensorflow2 #Soft-actor-critic #最大エントロピー強化学習

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2020-12-26から1日間の記事一覧

Soft Actor-Critic (SAC) ②tensorflow2による実装