HOMELv045 LLMのファインチューニング手法「LoRA」において、学習対象となる行列のランク(階数)はどう設定されるか。 2026年3月13日 パラメータ更新量を低ランク行列の積(A×B)で近似することで、学習すべきパラメータ数を劇的に削減する。 RLHF(Reinforcement Learning from Human Feedback)において、報酬モデル(Reward Model)は何を学習するか。 消毒用エタノールの適切な濃度範囲はどれか。