素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
統計検定 データサイエンス発展
「統計検定 データサイエンス発展」の記事一覧
MCMC法において、定常分布(事後分布)に到達するまでの、サンプルの初期段階の破棄期間を何というか。
初期値の影響を排除するために、サンプリングの最初の数千個程度を捨てる操作です。
2026年5月15日
多数派クラスのデータを減らすことで、少数派クラスとの比率を調整する手法を何というか。
多数派の情報を捨てることになりますが、モデルが少数派を無視するのを防ぎます。
2026年5月15日
Hadoopエコシステムにおいて、分散ファイルシステム上のデータをSQLライクな言語で集計できるツールはどれか。
HiveはMapReduceなどの複雑な処理をSQL(HiveQL)で記述できるようにしたツールです。
2026年5月15日
誤差逆伝播法において、活性化関数にシグモイド関数を使用した場合に発生しやすい問題はどれか。
シグモイド関数は入力が極端な値のときに微分の値がほぼ0になるため、勾配が消えてしまいます。
2026年5月15日
適合度検定や独立性の検定において、検定統計量は自由度何(k:カテゴリ数)のカイ二乗分布に従うか。
カテゴリ間の独立性や適合度を調べる際の自由度は、一般にカテゴリ数から1を引いた値になります。
2026年5月15日
決定木の構築において、分割後の各ノードのエントロピーが分割前よりどれだけ減少したかを示す指標はどれか。
情報利得(Information Gain)を最大化するように分割変数を選択します。
2026年5月15日
確率変数 $X, Y$ が独立であるとき、$V[X – Y]$ はどのように計算されるか。
独立であれば共分散は0であり、分散の加法性により差の分散も和になります。
2026年5月15日
母集団をいくつかの層に分けた後、特定の層からのみ全サンプルを抽出する手法を何というか。
クラスター抽出は集団(クラスター)単位で調査を行うため、コスト削減に有効です。
2026年5月15日
最近傍法(k-NN)において、$k$の値を大きくしたときのモデルの変化として正しいものはどれか。
$k$を大きくすると滑らかな境界になり、個別のデータの影響を受けにくくなる(バリアンスが下がる)一方、…
2026年5月15日
時系列データにおいて、過去の自分自身の値と現在の値との相関を何というか。
ラグ(時間差)を伴う自分自身との相関を自己相関と呼びます。
2026年5月15日
投稿のページ送り
1
…
5
6
7
…
82