HOMELv055 エージェントが報酬を最大化するために;「今の状態からゴールまで」を予測するのではなく、「ゴールから逆向きに」考える手法を何というか。 2026年1月25日 長いステップが必要な課題において;効率的に探索を進めるための手法。 複数のAIモデルを並列に動かし;最も早く、または最も精度の高い回答を出したモデルの結果を採用するインフラ構成を何というか。 LLMのトークナイザーにおいて;単語を構成する「バイト(Byte)」レベルで処理を行い、未知語を完全に無くす手法はどれか。