HOMELv059 LLMの推論において;「次に来るトークンの確率分布」から特定のトークンを選ぶ際、上位k個の中から選ぶ手法を何というか。 2026年1月25日 出力の多様性と一貫性のバランスを調整するデコーディング手法。 強化学習において;エージェントが「環境の状態」を完全には把握できず;不完全な情報から判断を下さなければならない枠組みを何というか。 ニューラルネットワークのパラメータを「重み(Weight)」だけでなく「ビット幅(Precision)」も含めて動的に変更する学習手法を何というか。