動画認識における「3D CNN」の特徴的な操作はどれか。

空間(縦・横)に加えて時間軸方向にもカーネルをスライドさせることで、動きの特徴を抽出する。