HOMELv068 LLMの入力プロンプトにおいて;「前回の回答を参考にして、以下の点を修正してください」のように、複数のやり取りを経て精度を高める手法を何というか。 2026年1月25日 一度の指示で完璧を求めず;対話を通じて回答を洗練させるプロセス。 強化学習において;エージェントが「どのような順番でタスクを学ぶべきか」を決定し;簡単なものから段階的に難易度を上げる学習手法はどれか。 ニューラルネットワークの「学習の速さ」を動的に調整する際;「過去の勾配の蓄積」を利用して、よく動くパラメータの学習率を下げ、あまり動かないパラメータの学習率を上げる手法はどれか。