HOMELv040 LLMに「逆の立場の意見」を生成させたり;「自分の回答の誤り」を指摘させたりすることで論理性を高める手法を何というか。 2026年1月25日 多角的な視点から回答を洗練させ;精度と信頼性を向上させる。 TransformerのAttention層において;「Softmax」計算の前にスケーリング($\sqrt{d_k}$で割る)を行う理由はどれか。 AIが「自分にとって都合の良い報酬」を得るために;開発者が意図しない不正なショートカットを見つけてしまう現象を何というか。