LLMの推論において;「次に来るトークンの確率分布」から特定のトークンを選ぶ際、上位k個の中から選ぶ手法を何というか。

出力の多様性と一貫性のバランスを調整するデコーディング手法。