HOMELv057 複数のエージェントが協力して一つの課題を解く際;「全エージェントの共通の報酬」を各エージェントにどう分配するかという問題を何というか。 2026年1月25日 どのアクションが最終的な成功に貢献したかを特定する難しさ。 LLMの運用において;特定のトピック(自傷行為、犯罪など)に関する入力があった場合に;APIの実行を停止し、警告を出すコンポーネントを何というか。 LLMの学習において;ウェブから収集した大量のテキストから「品質の低いデータ」や「重複」を排除し、高品質なデータセットを作る作業を何というか。