LLMのファインチューニング手法「LoRA」において、学習対象となる行列のランク（階数）はどう設定されるか。

2026年3月13日

パラメータ更新量を低ランク行列の積（A×B）で近似することで、学習すべきパラメータ数を劇的に削減する。

RLHF（Reinforcement Learning from Human Feedback）において、報酬モデル（Reward Model）は何を学習するか。

消毒用エタノールの適切な濃度範囲はどれか。