Q学習を拡張し;複数のエージェントが互いに影響し合いながら学習する枠組みを何というか。

自動運転車同士のすれ違いやゲームなどで用いられる。