素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
データサイエンティスト検定™ リテラシー
「データサイエンティスト検定™ リテラシー」の記事一覧
複数のデータソースから定期的にデータを抽出し、加工してデータウェアハウスにロードする一連の処理はどれか。
Extract(抽出)、Transform(加工)、Load(書き込み)の略である。
2026年1月25日
一定期間内にサービスを解約した顧客の割合を示す、サブスクリプション型ビジネスで重要な指標はどれか。
チャーンレート(解約率)を低く抑えることが、利益を積み上げるための鍵となる。
2026年1月25日
分析用データベースにおいて、行単位ではなく列単位でデータを格納し、集計処理を高速化する方式はどれか。
カラム指向(列指向)は、特定の列のみを読み込むため、大規模集計に適している。
2026年1月25日
企業の競争優位を「価値」「希少性」「模倣困難性」「組織」の4つの観点から評価する内部環境分析手法はどれか。
VRIO分析は、自社の持つ経営リソースがどれだけ持続的な競争優位を持つかを確認する。
2026年1月25日
回帰モデルの評価において、誤差の絶対値を平均した指標で、外れ値の影響が2乗誤差より小さいものはどれか。
MAE(平均絶対誤差)は、誤差に比例した評価を行うため、RMSEより外れ値に強い。
2026年1月25日
Kafkaなどのメッセージングシステムにおいて、データの送信側と受信側を直接繋がず、仲介役を置く構成を何と呼ぶか。
Pub/Sub型により、システム間の結合を疎にし、拡張性と柔軟性を高めることができる。
2026年1月25日
バイアスとバリアンスのトレードオフにおいて、モデルが複雑すぎて学習データのノイズに反応している状態はどう説明されるか。
複雑なモデルはバイアスは低いが、データが変わると予測が大きく変わる高バリアンスの状態になる。
2026年1月25日
ベイズ統計において、事前確率に尤度(データから得られる情報)を掛け合わせて得られる確率はどれか。
新しいデータを得るたびに事後確率を更新していくのがベイズ更新の特徴である。
2026年1月25日
データ分析のパイプラインにおいて、各タスクの依存関係を管理し、実行順序を制御する仕組みはどれか。
Apache Airflowなどが代表例で、複雑なジョブの実行管理を自動化する。
2026年1月25日
売上の8割は全顧客の2割が生み出している、というような現象を指す経験則はどれか。
パレートの法則(80:20の法則)は、分析において注力すべき対象を絞るのに役立つ。
2026年1月25日
投稿のページ送り
1
…
138
139
140
…
273