x64において、関数呼び出し時にスタックを16バイト境界に整列させる必要がある理由はどれか。

多くのSSE/AVX命令は16バイト整列されたメモリへのアクセスを要求するため、規約で定められている。