HOME
Lv077

「Lv077」の記事一覧

強化学習において；エージェントが「現実世界で失敗する」のを防ぐため、まず「オフラインの固定データ」だけで学習させる手法を何というか。

追加の試行錯誤を行わず、既存のログデータから最適な方策を見つけ出す。

2026年1月25日

AIが「特定の人種の顔」を認識しにくい原因が、学習データにその人種が少なすぎること（データの不備）である場合、これを何バイアスと呼ぶか。

収集されたデータ自体が現実の分布を反映していないために生じる偏り。

2026年1月25日

LLMのAPIコストを最適化するために；「簡単な質問」には高速で安価なモデルを使い、「難しい質問」には高性能なモデルを使う切り替え機能を何というか。

コストパフォーマンスを最大化するための、実務的なオーケストレーション技術。

2026年1月25日

AIを導入した際；「これまでの投資（サンクコスト）」に執着して、より優れた新しいAI技術への移行をためらってしまう現象を何というか。

過去の成功や投資が、イノベーションを阻害する足かせになるリスク。

2026年1月25日

モデルが予測した結果が「なぜそうなったか」を；そのデータの「近くにある他のデータ」と比較して、判断の境界線を説明する手法はどれか。

複雑なモデルの局所的な挙動を、単純な線形モデルで近似して説明する。

2026年1月25日

非常に多くの説明変数がある場合；「重要な変数だけを選択」しつつ、モデルの「過学習を抑制」する正則化手法（L1正則化）の名称はどれか。

不要な変数の重みをゼロにすることで、モデルの解釈性と精度を両立する。

2026年1月25日

「AIガバナンス」の議論において；AIが「人間に嘘をつく（Deception）」ことを防ぐために、モデルの「思考（隠れ状態）」を監視する手法を何というか。

出力を変えずに、内部で「騙そうとしているか」を検知しようとする試み。

2026年1月25日

LLMの学習において；「回答の良さ」を直接最適化するのではなく、人間の好みの「順位（Preference）」から報酬を推定するプロセスの名称はどれか。

RLHFにおける重要なステップで、人間の「感覚」を数値化してモデルに伝える。

2026年1月25日

AIによるビデオ解析において；「物体が画面の外に消えても、再び現れたときに同一だと認識する」ための長期的な一貫性を保つ技術を何というか。

遮蔽（オクルージョン）や画面外移動に対応するための高度な追跡技術。

2026年1月25日

ニューラルネットワークの「各層の重み」を、特定の幾何学的な「群（Group）」に対して不変・等変にする設計（例：回転しても結果が同じ）を何というか。

データの持つ対称性を利用し、少ない学習データで高い汎化性能を得る手法。

2026年1月25日