LLMの推論において；「Aという単語の次はBが来やすい」というKVキャッシュの一部を、複数の推論リクエスト間で共有してメモリを節約する技術はどれか。

2026年1月25日

KeyとValueを全ヘッドで共有することで、メモリ帯域のボトルネックを解消する。

AIが特定の個人の「購買意欲」や「脆弱性」を予測し、気づかれないように行動を操作する「ダークパターン」を規制する考え方はどれか。

エージェントが「何をすべきか」という目標（Goal）自体を動的に生成し、自己学習を繰り返す強化学習の枠組みを何というか。