LLMの推論において；Attentionの計算を時間軸方向に分割して並列化し；デコード速度を高速化するアルゴリズムはどれか。

2026年1月25日

長いコンテキストを持つモデルの推論を大幅にスピードアップさせる技術。

LLMの学習において；人間の好みのデータから直接「報酬関数を介さずに」モデルを最適化する手法はどれか。

画像内の「あらゆる物体」をゼロショットで切り出すことができる；Metaが開発したセグメンテーションモデルはどれか。