AIの出力が人間の価値観に合致するように；あらかじめ定義された「AIのための憲法（規則群）」を用いて自己修正させる手法はどれか。

2026年1月25日

Anthropicが提唱した；人間の評価に依存しすぎないアライメント手法。

複数の異なる微調整（Fine-tuning）を施した同一アーキテクチャのモデルを；重みの平均をとるなどの方法で統合する手法を何というか。

LLMの入力として画像・音声・動画・テキストを等価なトークンとして扱い；単一のトランスフォーマーで処理するモデルを何と呼ぶか。