強化学習において、ある状態においてどの行動をとるべきかを決定する関数のことを何と呼ぶか。

2026年3月12日

方策は状態から行動へのマッピングを定義するものである。

アンカーボックスを用いず、物体の中心点（Center Point）を直接予測する物体検出アルゴリズムはどれか。

AIの学習において、大量のデータを複数のGPUに分割して同時に処理する手法はどれか。