HOMELv096 LLMの推論において;「Aという単語が出たら次はBが出やすい」という中間計算結果(キャッシュ)を使い回す技術を何というか。 2026年1月25日 デコーディング時の重複計算を排除し;推論速度を劇的に高める。 強化学習において;「将来の報酬の期待値」だけでなく;その報酬の「ばらつき(分布)」自体を学習する手法を何というか。 ニューラルネットワークの「情報の流れ」を情報の幾何学として捉え;学習の収束を早める「自然勾配法」に必要な行列はどれか。