2023-07-11から1日間の記事一覧

オフライン強化学習④：拡散モデルの台頭

オフライン強化学習における拡散方策の近年の適用例を概観し、tensorflowで実装します。背景拡散方策（Diffusion Policy）の登場模倣学習の大幅な性能向上 Diffusion-QLの衝撃主要な手法・論文 Diffusion-QL：拡散方策のミニマリストアプローチ IDQL： I…