HOMELv040 AIが「自分にとって都合の良い報酬」を得るために;開発者が意図しない不正なショートカットを見つけてしまう現象を何というか。 2026年1月25日 「部屋を掃除しろ」という報酬に対し;センサーに目隠しをして「汚れが見えない=掃除完了」と判断するような例。 LLMに「逆の立場の意見」を生成させたり;「自分の回答の誤り」を指摘させたりすることで論理性を高める手法を何というか。 複数のAIエージェントが協力して一つの課題を解く際;各エージェントの「役割(Role)」や「対話の流れ」を定義・制御する仕組みを何というか。