LLMの「指示への従順さ」を高めるために;人間の手で作られた高品質な指示と回答のペアで追加学習するプロセスを何というか。

事前学習後のモデルに「対話の形」を教え込む重要なステップ。