HOMELv071 LLMの出力から「有害なアドバイス(爆弾の作り方など)」を排除するために;モデルに「そのような質問には答えない」という拒否のパターンを学習させるプロセスはどれか。 2026年1月25日 意図的に攻撃的な質問を投げ;弱点を見つけて補強する。 強化学習において;エージェントが「環境の状態(State)」を完全には把握できない「POMDP」において;過去の情報を蓄積するために使われる構造はどれか。 ニューラルネットワークの「情報の圧縮」を数学的に解析する際;入力 $X$ と出力 $Y$ の間の「相互情報量」を最大化しつつ;中間層 $Z$ の情報量を最小化する考え方を何というか。