素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
IBM Data Science Professional Certificate
「IBM Data Science Professional Certificate」の記事一覧
単語の意味的な類似性を計算するために使われる「コサイン類似度」の値の範囲はどれか。
コサイン類似度は2つのベクトルのなす角の余弦(cos)であり方向が完全に一致すれば1となる。
2026年3月12日
クラスタリングにおいて事前にクラスター数を決める必要がない手法はどれか。
DBSCANはデータの密度に基づいてクラスターを形成するため事前の数指定が不要である。
2026年3月12日
「私はリンゴを食べる」という文を「私」「は」「リンゴ」「を」「食べる」に分ける処理を何と呼ぶか。
形態素解析は文章を意味を持つ最小単位に分割し品詞などを判定するNLPの基本工程である。
2026年3月12日
MapReduceにおいてデータの集計処理を担当するフェーズはどれか。
ReduceフェーズはMapフェーズで処理された中間データをキーごとにまとめ集計結果を出力する。
2026年3月12日
時系列データの長期的な依存関係を学習するために設計されたRNNの一種はどれか。
LSTM(Long Short-Term Memory)はゲート機構により情報を長く保持することが可能である。
2026年3月12日
ニューラルネットワークの各層の出力を平均0;分散1に調整し学習を安定させる手法はどれか。
バッチ正規化は勾配消失を防ぎ学習速度を向上させる効果がある。
2026年3月12日
データリーク(Data Leakage)とはどのような状態を指すか。
データリークが発生するとモデルの精度が不自然に高くなり本番環境で使いものにならなくなる。
2026年3月12日
モデルの評価時に「100人中1人の患者を見逃さないこと」が最優先の場合に重視すべき指標はどれか。
再現率は実際の陽性者のうち正しく陽性と判定できた割合であり見逃しを減らしたい場合に重要となる。
2026年3月12日
サポートベクターマシンでデータを分離する際に最も近いデータ点との距離を最大化する境界を何と呼ぶか。
SVMはマージン(境界とデータの隙間)を最大化することで汎化性能の高い識別を行う。
2026年3月12日
特徴量の値が非常に大きい変数がモデルに過度な影響を与えないように調整することを何と呼ぶか。
スケーリングを行うことで異なる単位や範囲を持つ特徴量を公平な基準で比較できるようにする。
2026年3月12日
投稿のページ送り
1
…
94
95
96
…
256