素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Databricks Certified Data Engineer Associate
「Databricks Certified Data Engineer Associate」の記事一覧
文字列内の特定のパターンを別の文字列に置き換える関数はどれか。
regexp_replaceは正規表現に一致するすべての箇所を指定した文字列で置換します。
2026年3月8日
ジョブの「同時実行数」を1に制限し、前の実行が終わるまで次の実行を待機させる設定はどれか。
最大同時実行数を1に設定することで、同じジョブが同時に複数走ることを防ぎます。
2026年3月8日
ダッシュボードの「パラメータ」を使用して、ユーザーが入力した値に基づいて表示データを動的にフィルタリングできるか。
クエリ内でパラメータ({{ }})を定義することで、ダッシュボード上でユーザーが値を変更できるようになり…
2026年3月8日
シルバー層でデータの「正規化」を行う際、重複を排除するために使用される一般的な関数はどれか。
DataFrame APIのdropDuplicates()を使用すると、特定の列に基づいて重複行を簡単に削除できます。
2026年3月8日
Unity Catalogで定義された「ビュー」のソースとなっているテーブルの名前を変更した場合、ビューはどうなるか。
ビューは定義時のテーブル名を静的に参照するため、元のテーブル名が変更されると参照エラーになります。
2026年3月8日
DLTパイプラインが実行される際、使用される計算リソースの「自動スケーリング」を管理する機能はどれか。
Enhanced AutoscalingはDLT専用の機能で、ストリーミング負荷に応じて最適にリソースを増減させます。
2026年3月8日
ウィンドウ関数において、現在の行から末尾までの行を範囲として指定する句はどれか。
UNBOUNDED FOLLOWINGを指定することで、現在の行からパーティションの最後までの範囲を定義できます。
2026年3月8日
Deltaテーブルの特定のファイルがどの範囲のデータ(Min/Max)を持っているかを示す情報はどこに保存されるか。
統計情報はトランザクションログ(_delta_log)内に保持され、データスキッピングに利用されます。
2026年3月8日
Auto Loaderが新しいファイルを検出するために、クラウドプロバイダーのキューサービスを利用するモードはどれか。
ファイル通知モードは、SNS/SQSなどのイベント通知サービスを使用して新着ファイルを検知します。
2026年3月8日
集計クエリにおいて、ウォーターマークよりも大幅に遅れて到着したデータはどう処理されるか。
ウォーターマークで定義された閾値を超えて遅延したデータは、ステートから削除されているため破棄されま…
2026年3月8日
投稿のページ送り
1
…
71
72
73
…
153