LLMの学習データに含まれる「著作権侵害の疑いがあるテキスト」を特定・除去するために用いられる重複検知技術を何というか。

2026年1月25日

データの質を高めると同時に；法的・倫理的リスクを低減する。

強化学習において；報酬が得られるまでが非常に長いタスクを解くために；大きな課題を小さなサブ課題に分割して学習する手法はどれか。

ニューラルネットワークの「情報の圧縮効率」を情報の伝達量（相互情報量）で解析する理論を何というか。