素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
統計検定 データサイエンス発展
「統計検定 データサイエンス発展」の記事一覧
分散処理フレームワークであるApache Sparkにおいて、メモリ上でデータを保持する抽象的なデータ構造を何というか。
RDD(Resilient Distributed Dataset)はSparkの基本となる耐故障性のある分散データ集合です。
2026年5月15日
時系列データの自己相関が、時間の経過とともに減衰せず一定の周期を持つ性質を何というか。
特定の周期(12ヶ月など)で相関が高まる性質を季節性と呼びます。
2026年5月15日
ベイズの定理において、事象Aが起こったという条件の下で事象Bが起こる確率を何というか。
観測データ(条件)が得られた後に更新される確率を事後確率と呼びます。
2026年5月15日
勾配降下法において、一度の更新に全データではなく一部のデータ(バッチ)を使用する手法はどれか。
確率的勾配降下法(SGD)やミニバッチ法は計算コストを抑えつつ局所解を回避しやすくします。
2026年5月15日
不均衡データに対する評価において、精度(Accuracy)の代わりに重視すべき指標はどれか。
AUC(ROC曲線下面積)はクラスの不均衡に影響されにくく、分類性能を総合的に評価できます。
2026年5月15日
過学習を防ぐために損失関数にパラメータの絶対値の和を加える正則化手法はどれか。
L1正則化(Lasso)は係数をゼロに近づけ、特徴量選択の効果を持ちます。
2026年5月15日
重回帰分析において、説明変数間に強い相関があることで推定が不安定になる現象を何というか。
説明変数間の強い相関は多重共線性(マルチコリニアリティ)と呼ばれ、係数の標準誤差を増大させます。
2026年5月15日
探索アルゴリズムのうち、ソート済みのデータに対して中央の値と比較を繰り返す手法はどれか。
二分探索は範囲を半分に絞り込んでいくため、計算効率が非常に高い手法です。
2026年5月15日
量子コンピュータを用いた機械学習において、量子状態の重なりを利用した並列計算の利点を何というか。
量子コンピュータが古典コンピュータを圧倒する性能を示すことを量子超越性と呼びます。
2026年5月15日
時系列データにおいて、一定の周期で繰り返される変動パターンを何というか。
1年や1週間など決まった周期で発生する変動を季節変動と呼びます。
2026年5月15日
投稿のページ送り
1
…
17
18
19
…
82