2022-10-30から1日間の記事一覧

2022-10-30

オフライン強化学習① Conservative Q-Learning (CQL)の実装

オフライン強化学習の有名手法CQLについて、簡単な解説とともにブロック崩し環境向けのtf2実装を紹介します [2006.04779] Conservative Q-Learning for Offline Reinforcement Learning sites.google.com はじめに：オフライン強化学習とは問題設定：ゲーム…

#強化学習

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2022-10-30から1日間の記事一覧

オフライン強化学習① Conservative Q-Learning (CQL)の実装