2020-07-01から1日間の記事一覧

2020-07-01

TD3の解説・実装（強化学習）

Tensorflow2で連続値制御のための強化学習手法 TD3 (Twin Delayed DDPG)を実装し二足歩行を学習します。画像元：https://starwars.disney.co.jp/character/at-at-walker.html はじめに：TD3とは 1. Clipped Double Q learning 2. Target Policy Smoothing 3…

どこから見てもメンダコ

軟体動物門頭足綱八腕類メンダコ科

2020-07-01から1日間の記事一覧

TD3の解説・実装（強化学習）