LLMの学習において；「推論過程」の正しさに対して報酬を与えることで、最終結果だけでなく論理的整合性を高める手法を何というか。

2026年1月25日

一歩一歩の思考ステップ（Step-by-step）を評価し、ハルシネーションを抑制する。

AIを導入した際の「負の外部性」として；個人の好みに合わせた最適化が情報の偏りを生み、社会の分断を招く現象を経済学的に何と呼ぶか。

AIが特定の個人の「購買意欲」や「脆弱性」を予測し、気づかれないように行動を操作する「ダークパターン」を規制する考え方はどれか。