HOMELv009 モデルの精度を維持しつつ、重みの精度を32bit浮動小数点から8bit整数などに下げる技術はどれか。 2026年3月12日 量子化はモデルのサイズを削減し、推論速度を向上させる。 データを中央に集めず、各ローカルデバイスで学習して重みのみを共有する手法はどれか。 推論リクエストが急増した際に、自動で計算リソースを増強するクラウドの仕組みはどれか。