素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv077
「Lv077」の記事一覧
強化学習において;エージェントが「現実世界で失敗する」のを防ぐため、まず「オフラインの固定データ」だけで学習させる手法を何というか。
追加の試行錯誤を行わず、既存のログデータから最適な方策を見つけ出す。
2026年1月25日
AIが「特定の人種の顔」を認識しにくい原因が、学習データにその人種が少なすぎること(データの不備)である場合、これを何バイアスと呼ぶか。
収集されたデータ自体が現実の分布を反映していないために生じる偏り。
2026年1月25日
LLMのAPIコストを最適化するために;「簡単な質問」には高速で安価なモデルを使い、「難しい質問」には高性能なモデルを使う切り替え機能を何というか。
コストパフォーマンスを最大化するための、実務的なオーケストレーション技術。
2026年1月25日
AIを導入した際;「これまでの投資(サンクコスト)」に執着して、より優れた新しいAI技術への移行をためらってしまう現象を何というか。
過去の成功や投資が、イノベーションを阻害する足かせになるリスク。
2026年1月25日
モデルが予測した結果が「なぜそうなったか」を;そのデータの「近くにある他のデータ」と比較して、判断の境界線を説明する手法はどれか。
複雑なモデルの局所的な挙動を、単純な線形モデルで近似して説明する。
2026年1月25日
非常に多くの説明変数がある場合;「重要な変数だけを選択」しつつ、モデルの「過学習を抑制」する正則化手法(L1正則化)の名称はどれか。
不要な変数の重みをゼロにすることで、モデルの解釈性と精度を両立する。
2026年1月25日
「AIガバナンス」の議論において;AIが「人間に嘘をつく(Deception)」ことを防ぐために、モデルの「思考(隠れ状態)」を監視する手法を何というか。
出力を変えずに、内部で「騙そうとしているか」を検知しようとする試み。
2026年1月25日
LLMの学習において;「回答の良さ」を直接最適化するのではなく、人間の好みの「順位(Preference)」から報酬を推定するプロセスの名称はどれか。
RLHFにおける重要なステップで、人間の「感覚」を数値化してモデルに伝える。
2026年1月25日
AIによるビデオ解析において;「物体が画面の外に消えても、再び現れたときに同一だと認識する」ための長期的な一貫性を保つ技術を何というか。
遮蔽(オクルージョン)や画面外移動に対応するための高度な追跡技術。
2026年1月25日
ニューラルネットワークの「各層の重み」を、特定の幾何学的な「群(Group)」に対して不変・等変にする設計(例:回転しても結果が同じ)を何というか。
データの持つ対称性を利用し、少ない学習データで高い汎化性能を得る手法。
2026年1月25日
投稿のページ送り
1
2
3
4
…
14