HOMELv051 エージェントが「失敗から学ぶ」ために;あえて報酬をマイナスにして学習させる手法を何というか。 2026年1月25日 「ここを通ってはいけない」「これをしてはいけない」を教えるための設計。 LLMの運用において;特定の「キーワード」や「意図」が含まれた入力を検知し;それに対する回答をあらかじめ用意した安全なものに差し替える機能を何というか。 LLMに「複数の異なる視点のプロンプト」を同時に与え;その回答を合議制で決定させることで頑健性を高める手法はどれか。