HOMELv030 LLMに非常に長い指示を与えた際;「文章の最初と最後」の情報は覚えているが;真ん中を忘れてしまう現象を何というか。 2026年1月25日 アテンションの性質上;長い文脈の中央付近の感度が落ちる問題。 報酬が一切得られない環境で;エージェントが「環境の変化(新奇性)」自体を報酬と感じて探索を行う仕組みはどれか。 重みの行列を「低ランクの行列」の積に近似し;学習対象を劇的に減らすPEFTの代表的手法はどれか。