【シナリオ】高負荷なServingエンドポイントにおいて、コンテナの起動時間(Cold Start)が遅く、スケールアウト時のレイテンシ悪化が問題になっている。これを改善するためのモデル最適化手法はどれか。

コンテナ起動時間(モデルロード時間)は、モデルファイルのダウンロードとメモリ展開、依存ライブラリのロード時間に支配されるため、モデル圧縮や環境の最小化が直接的な改善策となる。