強化学習において、モデルが未知の行動を試すことと、既に知っている高い報酬の行動をとることのバランスを何と呼ぶか。

2026年3月13日

新しい可能性を探る（探索）のと、現在のベストを維持する（活用）の調整が重要。

テキストから3Dモデルを生成する技術（Text-to-3D）において、一般的に使用されるAIモデルはどれか。

自治体がAIを活用して、保育所の入所選考を自動化する主なメリットはどれか。