素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
IBM Data Science Professional Certificate
「IBM Data Science Professional Certificate」の記事一覧
決定木において分割の不純度を測定する指標として使われるのはどれか。
ジニ係数はノード内のクラスの混ざり具合を示し分割の基準として一般的に利用される。
2026年3月12日
ランダムフォレストにおいて「ブートストラップ・アグリゲーティング」を略した名称はどれか。
バギング(Bagging)は複数のモデルを並列に学習させ結果を平均または多数決で統合する手法である。
2026年3月12日
k-近傍法(k-NN)において予測に影響を与える主なパラメータはどれか。
k-NNは未知データの周辺にあるk個のデータの多数決で分類を決定するアルゴリズムである。
2026年3月12日
ROC曲線のグラフの下側の面積を示す指標は何と呼ばれるか。
AUC(Area Under the Curve)は0から1の値をとり1に近いほどモデルの識別性能が高い。
2026年3月12日
欠損値(Missing Value)の処理方法として適切でないものはどれか。
欠損値を無関係な大きな値で埋めるとモデルのバイアスを不当に歪めるため不適切である。
2026年3月12日
3つ以上のグループの平均値に差があるかを検定する手法はどれか。
分散分析は3群以上の標本において平均値の差を統計的に比較する場合に使用される。
2026年3月12日
バイアスとバリアンスのトレードオフにおいてバリアンスが高い状態とは何か。
高バリアンスは訓練データの細かなノイズまで学習してしまい汎化性能が落ちている状態を指す。
2026年3月12日
過学習(オーバーフィッティング)を防ぐための手法として適切なものはどれか。
正則化はモデルの複雑さにペナルティを課すことで未知データへの汎化性能を高める手法である。
2026年3月12日
データを類似性に基づいてグループ化する手法はどれか。
クラスタリングは共通の特徴を持つデータポイントを同じグループにまとめる手法である。
2026年3月12日
回帰モデルの誤差を評価するための指標(平均絶対誤差)の略称はどれか。
MAE(Mean Absolute Error)は予測値と実測値の差の絶対値を平均した指標である。
2026年3月12日
投稿のページ送り
1
…
105
106
107
…
256