素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv014
「Lv014」の記事一覧
特徴量の分布が極端にロングテール(右に歪んだ分布)である場合、正規分布に近づけるために一般的に適用される変換はどれか。
対数変換は大きな値を圧縮し、小さな値を引き延ばす効果があるため、右に歪んだ分布の補正に非常に有効。
2026年3月3日
Amazon Kinesis Data Firehoseにおいて、S3へのバックアップとして「すべての元データ」を保存しつつ、変換後のデータも別のS3パスに保存する機能はどれか。
Source record backup(元レコードのバックアップ)を有効にすることで、変換前の生データを別途保存して…
2026年3月3日
SageMakerのトレーニングジョブで、学習の進捗(損失関数の値など)をAmazon CloudWatchメトリクスとしてリアルタイムで表示するために必要な設定はどれか。
標準出力に出力されたログをSageMakerが正規表現でパースし、カスタムメトリクスとしてCloudWatchに送信す…
2026年3月3日
Amazon Personalizeで、ユーザーが最近閲覧したアイテムや最近の行動に基づいて、推薦内容をリアルタイムで変化させるために必要なコンポーネントはどれか。
Event Tracker経由でクリックや購入などのイベントをリアルタイムに送信することで、推薦モデルが現在の意…
2026年3月3日
AWS Glueのジョブが長時間実行され、特定のExecutorのみが過負荷でメモリ不足(OOM)になる現象の主な原因はどれか。
データスキューが発生すると、特定のパーティションを処理するExecutorにデータが集中し、分散処理の効率…
2026年3月3日
Amazon SageMakerでモデルをデプロイした後、特定の予測結果に至った理由(特徴量の寄与度)をリアルタイムで取得する機能はどれか。
オンライン説明可能性機能を使用すると、個々の推論リクエストに対してSHAP値などの説明情報を同時に返す…
2026年3月3日
Amazon SageMakerの「XGBoost」において、決定木の最大数を指定するハイパーパラメータはどれか。
num_roundは、ブースティングの反復回数(作成される決定木の総数)を決定する。
2026年3月3日
テキストマイニングにおいて、単語の出現頻度(TF)だけでなく、多くの文書に出現する単語の重要度を下げる(IDF)手法を何と呼ぶか。
TF-IDFは、その文書内での出現頻度が高く、かつ他の文書ではあまり使われない単語に高いスコアを与える。
2026年3月3日
Amazon S3に保存された機密データに対して、特定のIAMユーザーが特定の時間帯(例:勤務時間内)にのみアクセスできるように制限する設定はどれか。
Condition要素に日付や時刻の比較演算子を追加することで、きめ細かなアクセス時間制限が可能。
2026年3月3日
Amazon SageMakerで数千億のパラメータを持つ超巨大モデルを分散学習させる際、各GPUのメモリに収まらないモデルを分割して配置する手法はどれか。
モデル並列(SM Model Parallel等)は、モデルの層やパラメータ自体を複数のGPUに分割して保持し、協力し…
2026年3月3日
投稿のページ送り
1
…
956
957
958
…
1,106