AIモデルの「推論」における総コストを削減するために；難易度に応じてモデルを動的に選択する手法を何というか。

2026年1月25日

安価な小型モデルと高価な大型モデルを使い分けコストを最適化する。

LLMのAPIの応答時間を予測し；レスポンスが遅い場合に自動で「軽いモデル」に切り替える手法を何というか。

Mixture of Experts (MoE) において；特定の専門家（Expert）に負荷が集中するのを防ぐために損失関数に加えられる項はどれか。