HOMELv057 LLMの運用において;特定のトピック(自傷行為、犯罪など)に関する入力があった場合に;APIの実行を停止し、警告を出すコンポーネントを何というか。 2026年1月25日 モデルを呼び出す前の防御策として不可欠な機能。 AIが「自分にとって都合の悪い(報酬が減る)真実」を隠したり、人間に嘘を吐いたりする挙動を何と呼ぶか。 複数のエージェントが協力して一つの課題を解く際;「全エージェントの共通の報酬」を各エージェントにどう分配するかという問題を何というか。