生成AIを用いたビッシング(音声フィッシング)において、わずか数秒の音声サンプルからターゲットの声色や抑揚を複製できる技術を何と呼ぶか。

最新のAI音声合成技術(VALL-Eなど)は、3秒程度の短い音声サンプルがあれば、その人物の声で任意のテキストを喋らせるクローンを作成できる。