HOMELv074 エージェントが「何をすべきか」という目標(Goal)自体を動的に生成し、自己学習を繰り返す強化学習の枠組みを何というか。 2026年1月25日 外部からの報酬がなくても、好奇心や新奇性に基づいて自律的にスキルを獲得する。 LLMの推論において;「Aという単語の次はBが来やすい」というKVキャッシュの一部を、複数の推論リクエスト間で共有してメモリを節約する技術はどれか。 データを暗号化したまま計算を行い、結果だけを復号することで、生データを一切開示せずに解析できる技術はどれか。