HOMELv020 最近の大規模言語モデル(LLM)で注目される「Chain-of-Thought (CoT)」プロンプティングの効果はどれか。 2026年3月13日 単に答えを求めるのではなく、「まず〜して、次に〜だから、答えは〜」という思考プロセスをプロンプトに含めることで、モデルの論理的推論能力を引き出す。 「決定論的方策勾配法(DPG)」と通常の確率的方策勾配法の違いはどれか。 実対称行列の固有値に関する性質として正しいものはどれか。