素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
AWS認定 Data Engineer (Associate)
「AWS認定 Data Engineer (Associate)」の記事一覧
AWS Glueジョブにおいて、データの歪み(Data Skew)が原因で特定のワーカーに負荷が集中している場合の改善策はどれか。
repartitionやcoalesceを使用して、データを各ワーカーに均等に再分配する。
2026年3月3日
Amazon S3にアップロードされたすべてのオブジェクトに対して、デフォルトでサーバー側の暗号化(SSE-S3)を強制する設定はどれか。
バケットの「デフォルトの暗号化」を有効にすると、指定なしのアップロードも自動で暗号化される。
2026年3月3日
Amazon S3で、1つのバケットに数十億のオブジェクトがある場合に、特定のプレフィックスを持つオブジェクトのリストを効率的に取得する方法はどれか。
S3 Inventoryは、オブジェクトとそのメタデータのリストをCSV/ORC/Parquet形式で定期的に生成する。
2026年3月3日
Amazon Kinesis Data Streamsのデータを、複数の独立したアプリケーションで同時に読み取るための推奨機能はどれか。
Enhanced Fan-outを使用すると、各コンシューマーに専用のスループット(2MB/秒)が割り当てられる。
2026年3月3日
Amazon Redshiftでクエリの同時実行性を向上させ、急激なワークロード増に対応する機能はどれか。
Concurrency Scalingは、必要に応じてクラスターリソースを自動的に追加し、待機時間を解消する。
2026年3月3日
Amazon EMRクラスターにおいて、HDFS上のデータをS3へ効率的にコピーするためのツールはどれか。
DistCp(Distributed Copy)は、MapReduceを使用して大規模なデータセットを分散コピーする。
2026年3月3日
VPC内のリソースが、インターネットを経由せずにAmazon S3へアクセスするために必要なものはどれか。
S3用のVPCエンドポイント(ゲートウェイ型)を使用することで、内部ネットワーク経由で接続できる。
2026年3月3日
Amazon DynamoDBのLSI(ローカルセカンダリインデックス)に関する説明として正しいものはどれか。
LSIは基本テーブルと同じパーティションキーを持ち、異なるソートキーを持つインデックスである。
2026年3月3日
AWS Glueのジョブ内でPythonライブラリを使用したい場合、推奨される方法はどれか。
--extra-py-filesパラメータを使用してS3上のライブラリファイルをジョブに読み込ませる。
2026年3月3日
Amazon Redshift Spectrumを使用してS3のデータをクエリする際、必要となるコンポーネントはどれか。
外部テーブルの定義を保持するカタログ(Glue等)とクエリを実行するRedshiftクラスターが必要。
2026年3月3日
投稿のページ送り
1
…
114
115
116
…
150