HOMELv084 Transformerの計算量を $O(L^2)$ から $O(L)$ に削減する「State Space Models (SSM)」を用いた代表的なモデルはどれか。 2026年1月25日 Mambaは状態空間モデルをベースに推論の高速化と長文処理を両立したモデルである。 強化学習において;エージェントが「環境の状態」を遷移確率として完全にモデル化し、そのモデルを用いて頭の中で「想像学習」を行う手法を何というか。 モデルの重みを4ビット以下に量子化しつつ;学習可能な低ランク行列のみを更新することでメモリ効率を極大化した手法はどれか。