LLMの入力プロンプトにおいて；「前回の回答を参考にして、以下の点を修正してください」のように、複数のやり取りを経て精度を高める手法を何というか。

2026年1月25日

一度の指示で完璧を求めず；対話を通じて回答を洗練させるプロセス。

強化学習において；エージェントが「どのような順番でタスクを学ぶべきか」を決定し；簡単なものから段階的に難易度を上げる学習手法はどれか。

ニューラルネットワークの「学習の速さ」を動的に調整する際；「過去の勾配の蓄積」を利用して、よく動くパラメータの学習率を下げ、あまり動かないパラメータの学習率を上げる手法はどれか。