動画像解析において;「誰が(Subject)」「何をしているか(Action)」を統合的に理解するタスクを何というか。

時空間的な情報の繋がりをグラフ構造などでモデル化する。