「CLIP (Contrastive Language-Image Pre-training)」が学習するタスクは何か。

2026年3月13日

Web上の大量の画像とテキストのペアを用い、正しいペアの類似度を上げ、誤ったペアの類似度を下げるように学習することで、汎用的な視覚-言語表現を獲得する。

AIモデルの軽量化手法「量子化（Quantization）」において、Post-training Quantizationとはいつ行うか。

「説明可能なAI（XAI）」における「Grad-CAM」は、何を可視化する手法か。