HOMELv022 自然言語処理の評価指標 BLEU スコアにおいて、主に比較されるものはどれか。 2026年4月3日 機械翻訳の結果と参照訳がどれだけ単語の並び(N-gram)を共有しているかを測る。 連続確率分布の平均・分散・尖度・歪度を一挙に導出するために便利な関数はどれか。 オプティマイザ Lookahead が行う操作はどれか。