単体でRainbow越えを達成した深層分布強化学習手法FQFをtensorflow2で実装します。 はじめに C51 → QR-DQN → IQN FQFとは:いい感じのτを提案する機構付きのIQN FQFネットワークの実装 FQFアーキテクチャ Feature network:特徴抽出ネットワーク Fraction pr…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。