HOMELv091 複数のエージェントが協力する際;「全体の報酬」を各エージェントにどう分配するかという問題を何というか。 2026年1月25日 どのアクションが最終的な成功に貢献したかを特定する難しさ。 LLMの運用において;特定のトピック(暴力等)に関する入力があった場合に;APIの実行を停止し警告を出す機能を何というか。 ニューラルネットワークの「情報の伝播」をスムーズにするために;「活性化値の分散」が一定に保たれるように設計された初期化法はどれか。