LLMの出力を評価する際、正解データ（Ground Truth）がない場合に、別の高性能なLLM（GPT-4など）を評価者として使う手法を何というか。

2026年1月25日

人間による評価はコストが高いため、信頼できる強力なAIを「審査員」として代用する。

AIモデルが、特定の「禁止された知識」を保持していないことを数学的に証明し、それを消去するプロセスを何というか。

LLMの計算効率を向上させるため；特定のトークンに対してのみデコーダの全層を通し；重要度の低いトークンは層をスキップさせる手法はどれか。