LLMに非常に長いドキュメントを読み込ませる際；アテンションの計算範囲を制限してメモリ消費を線形に抑える構造を何というか。

2026年1月25日

Mistral 7Bなどで採用され；長いコンテキストの効率的な処理を可能にする。

強化学習において；エージェントが「未知の環境」を探索する際；自身の「世界モデル」が予測に失敗した度合いを報酬として与える手法はどれか。

ニューラルネットワークのパラメータを「1ビット（{-1, 1}）」に制限したモデルにおいて；重みの更新時に使われる「実数値の勾配」を何と呼ぶか。