動画像から「いつ、どこで、誰が、何をしたか」を記述する「ビデオ・キャプショニング」において;時間的な情報の流れを抽出するために使われる構造はどれか。

空間的な特徴に加えて;時間軸方向の変化を捉える必要がある。