HOME
IBM Data Science Professional Certificate

「IBM Data Science Professional Certificate」の記事一覧

次元削減手法の「t-SNE」が主に使用される目的はどれか。

t-SNEは高次元データの局所的な構造を保ったまま2次元や3次元に圧縮し可視化するのに優れている。

2026年3月12日

XGBoostやLightGBMが採用している学習手法の分類はどれか。

勾配ブースティングは前のモデルの残差を次のモデルで順次学習していく強力なアンサンブル手法である。

2026年3月12日

ランダムフォレストにおいてそれぞれの決定木が異なるデータのサブセットで学習することを何と呼ぶか。

ランダムフォレストは重複を許してランダムに抽出したデータ群（ブートストラップ）で複数の木を作る。

2026年3月12日

モデルが複雑すぎて訓練データには高い精度を示すがテストデータでは低い精度になる状態はどれか。

過学習はモデルが訓練データのノイズまで覚えてしまい新しいデータに対応できなくなる現象である。

2026年3月12日

文字列の「男性」「女性」を「0」「1」に変換する処理を何と呼ぶか。

ラベルエンコーディングはカテゴリ変数の各要素をユニークな整数値に置き換える処理である。

2026年3月12日

過学習を抑制するために重みの絶対値の和をペナルティとして加える正則化はどれか。

L1正則化は不要な特徴量の重みをゼロにする性質があり特徴量選択の効果も持つ。

2026年3月12日

ロジスティック回帰の出力値を0から1の範囲に変換するために使われる関数はどれか。

シグモイド関数は任意の数値を0から1の確率値に変換し二値分類の判定基準として使われる。

2026年3月12日

データ全体のばらつきを平方根で表したもので平均からの平均的な離れ具合を示す指標はどれか。

標準偏差は分散の正の平方根であり元のデータと同じ単位でばらつきを表現できる。

2026年3月12日

決定木において分割後の不純度が最小になるように選ばれるのはどれか。

決定木は各ステップで最もデータを効率よく分けられる特徴量と値を探索して分岐を作る。

2026年3月12日

適合率（Precision）と再現率（Recall）の調和平均をとった指標はどれか。

F1スコアは適合率と再現率のバランスを一つの数値で評価するために用いられる。

2026年3月12日