LLMに「逆の立場の意見」を生成させたり；「自分の回答の誤り」を指摘させたりすることで論理性を高める手法を何というか。

2026年1月25日

多角的な視点から回答を洗練させ；精度と信頼性を向上させる。

TransformerのAttention層において；「Softmax」計算の前にスケーリング（$\sqrt{d_k}$で割る）を行う理由はどれか。

AIが「自分にとって都合の良い報酬」を得るために；開発者が意図しない不正なショートカットを見つけてしまう現象を何というか。