LLMの出力から「有害なアドバイス（爆弾の作り方など）」を排除するために；モデルに「そのような質問には答えない」という拒否のパターンを学習させるプロセスはどれか。

2026年1月25日

意図的に攻撃的な質問を投げ；弱点を見つけて補強する。

強化学習において；エージェントが「環境の状態（State）」を完全には把握できない「POMDP」において；過去の情報を蓄積するために使われる構造はどれか。

ニューラルネットワークの「情報の圧縮」を数学的に解析する際；入力 $X$ と出力 $Y$ の間の「相互情報量」を最大化しつつ；中間層 $Z$ の情報量を最小化する考え方を何というか。