LLMに非常に長い指示を与えた際；「文章の最初と最後」の情報は覚えているが；真ん中を忘れてしまう現象を何というか。

2026年1月25日

アテンションの性質上；長い文脈の中央付近の感度が落ちる問題。

報酬が一切得られない環境で；エージェントが「環境の変化（新奇性）」自体を報酬と感じて探索を行う仕組みはどれか。

重みの行列を「低ランクの行列」の積に近似し；学習対象を劇的に減らすPEFTの代表的手法はどれか。