HOMELv087 強化学習のエージェントが「未知の環境」に適応する際;「過去のタスクで得た経験」を新しいタスクの学習に活かす分野を何というか。 2026年1月25日 「学習の仕方を学習する」ことで;新しい環境への適応スピードを劇的に高める。 LLMアプリケーションにおいて;出力されたコードが「実行可能か」「バグがないか」を隔離環境で自動テストするコンポーネントを何というか。 TransformerのAttention層において;「Softmax」計算の前にスケーリングを行う主な理由はどれか。