強化学習において；エージェントが「環境の状態」を完全には把握できず；不完全な情報から判断を下さなければならない枠組みを何というか。

2026年1月25日

センサーの死角やノイズがある現実世界のタスクをモデル化する。

LLMアプリケーションにおいて；出力結果の「トーン」や「言葉遣い」を、ユーザーの属性に合わせてリアルタイムで変更する技術を何というか。

LLMの推論において；「次に来るトークンの確率分布」から特定のトークンを選ぶ際、上位k個の中から選ぶ手法を何というか。