LLMの学習において;特定の単語の出現頻度に基づいてトークンを分割・結合する「BPE(Byte Pair Encoding)」が属するアルゴリズムの総称はどれか。

未知語への対応と語彙サイズのバランスをとるために;現代のLLMで広く採用されている手法。