AI（機械学習）において、エージェントが環境と相互作用し、報酬を最大化するように行動を学習する手法はどれか。

2026年4月15日

強化学習は、試行錯誤を通じて最適な行動方針（方策）を学習する手法であり、ゲームやロボット制御に応用される。

医療情報システムのガイドラインにおいて、個人の所有する端末を業務利用する「BYOD」の扱いとして適切なものはどれか。

組織の外部環境（機会・脅威）と内部環境（強み・弱み）を分析し、経営戦略を策定するフレームワークはどれか。