HOME
Lv094

「Lv094」の記事一覧

強化学習において；エージェントが「未知の環境」を探索する際；自身の「世界モデル」が予測に失敗した度合いを報酬として与える手法はどれか。

予測誤差を「好奇心」として定義し；未知の領域への探索を促す。

2026年1月25日

LLMの運用において；推論コストを削減するために；「似たような質問」に対する回答をセマンティック（意味的）に検索して再利用する機能を何というか。

LLMの呼び出し回数を減らし；応答速度とコストを改善する。

2026年1月25日

AIが特定の個人の「秘密」や「弱点」を推論し；それを悪用して詐欺を行うリスクを総称して何というか。

生成AIによる高度ななりすましや説得工作への警戒が必要である。

2026年1月25日

AIモデルの「スケーリング則」において；計算資源を増やした際に性能が飽和するのを防ぐために同時に増やすべき2つの要素はどれか。

計算量；モデルサイズ；データ量の3つが適切な比率で増える必要がある。

2026年1月25日

モデルの学習において；あらかじめ定義された「教師モデル」のソフトターゲットを「生徒モデル」が学習する手法を何というか。

巨大なモデルの知見を軽量なモデルに継承させる手法である。

2026年1月25日

高次元データの分析において；「全データの距離がほぼ等しくなってしまう」現象を避けるために用いられる；局所的な近傍関係を重視した次元圧縮手法はどれか。

高次元空間の構造を低次元で視覚化するのに適した非線形手法である。

2026年1月25日

拡散モデル（Diffusion Model）のサンプリングを高速化するために提案された；常微分方程式（ODE）として解く手法はどれか。

DDPMよりも大幅に少ないステップ数で高品質な画像を生成できる。

2026年1月25日

EU AI法（2024年成立）において；「感情認識システム」を職場や教育現場で利用することはどのように規定されているか。

人間の基本的権利を侵害する恐れがあるとして；特定の例外を除き禁止されている。

2026年1月25日

LLMのデコーディングにおいて；「確率の高いトークン」を固定的に選ぶのではなく；分布の裾野にあるトークンを一定確率で排除してからサンプリングする手法はどれか。

累積確率が一定値pに達するまでのトークン集合から選択する手法である。

2026年1月25日

Mixture of Experts (MoE) において；特定の専門家（Expert）に負荷が集中するのを防ぐために損失関数に加えられる項はどれか。

ルーターが各Expertを均等に選択するように促すための損失項である。

2026年1月25日