素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv009
「Lv009」の記事一覧
Amazon Transcribeにおいて、複数の話者が交互に話している音声を、誰がいつ話したかを識別する機能はどれか。
話者識別(Speaker Diarization)機能により、音声内の複数の話者を区別して記録できる。
2026年3月3日
SageMakerの「K-Means」アルゴリズムで、最適なクラスタ数(k)を決定するために「エルボー法」で使用する指標はどれか。
WCSS(クラスタ内誤差平方和)をプロットし、減少率が緩やかになる点を最適なkとするのがエルボー法。
2026年3月3日
AWS GlueのクローラがS3上のログデータをスキャンした際、日付ごとにフォルダが分かれている場合に作成されるテーブルの属性はどれか。
クローラは共通のスキーマを持つディレクトリ構造をパーティションとして自動認識する。
2026年3月3日
SageMaker Model Monitorにおいて、ベースライン統計量と実際の推論データの乖離を検出するために計算される距離指標はどれか。
PSIは2つの分布がどれだけ異なっているかを測定し、データドリフトの検知に使用される。
2026年3月3日
ターゲット変数(目的変数)が数値である場合、特徴量と目的変数の間の線形な関係の強さを測る統計量はどれか。
数値変数間の線形相関を評価するには、ピアソンの積率相関係数が最も一般的である。
2026年3月3日
Amazon SageMakerの「XGBoost」において、学習の早期終了(Early Stopping)をトリガーするために必要な条件はどれか。
検証セットでの誤差を監視し、改善が見られなくなった時点で学習を停止させることで、過学習を防ぐ。
2026年3月3日
Amazon S3において、オブジェクトの整合性モデルとして、書き込み直後の読み取りで保証されているものはどれか。
Amazon S3は、すべての操作(新規作成、更新、削除)に対して強力な書き込み後読み取り整合性を提供する。
2026年3月3日
Amazon Athenaで大量のJSONデータを検索する際、スキャンするデータ量を減らしパフォーマンスを向上させるために最も有効な手段はどれか。
列指向形式に変換することで、クエリに必要な列のみを読み取ることができ、コストと速度が改善される。
2026年3月3日
データの分散が最大になる方向を探し、その軸を新しい特徴量とする次元削減手法はどれか。
PCAは、データの情報を可能な限り保持しつつ、分散が大きい方向に直交する主成分を抽出する。
2026年3月3日
Amazon SageMaker Clarifyで「後処理バイアス」の修正が必要な場合、どのようなアプローチを取るべきか。
後処理バイアスは、モデルの予測確率に対してクラスごとの閾値を変更することで緩和できる。
2026年3月3日
投稿のページ送り
1
…
1,027
1,028
1,029
…
1,178