LLMの「指示への従順さ」を高めるために;高品質な「指示と回答のペア」で追加学習することを何というか。

事前学習後のモデルに対話の形を教え込むステップ。