素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv011
「Lv011」の記事一覧
クラスターの「Spot Instances(スポットインスタンス)」を使用するのに適していないワークロードはどれか。
スポットインスタンスはクラウドプロバイダによって強制中断されるリスクがあるため、停止が許されない重…
2026年3月8日
PySpark DataFrameをPandas DataFrameに変換するメソッドはどれか。
`df.toPandas()` メソッドを使用すると、Sparkの分散データをドライバーのメモリに集め、ローカルのPandas…
2026年3月8日
ブロンズ層(Bronze Layer)のデータの特徴として最も適切なものはどれか。
ブロンズ層は、ソースからのデータを可能な限り変更せず、生の状態で保存したものであり、再処理のための…
2026年3月8日
Auto Loader (`cloudFiles`) がファイル通知モード(File Notification mode)で使用するクラウドリソースはどれか。
File Notificationモードでは、ストレージへのファイル配置イベントを検知するために、クラウドプロバイダ…
2026年3月8日
Unity Catalogにおいて、特定のカタログ内の「全テーブル」に対する読み取り権限を付与するSQLコマンドはどれか。
Unity Catalogの権限継承モデルにより、カタログレベルで `SELECT` 権限を付与すると、その配下の全スキー…
2026年3月8日
Databricks Jobsで、前段のタスクが「失敗した場合のみ」実行されるタスクを設定するにはどうすればよいか。
Databricks JobsのUIまたはJSON定義で、タスクの実行条件(Run if)を「Some dependencies failed」や「Al…
2026年3月8日
Sparkの `repartition()` と `coalesce()` の違いについて、正しい説明はどれか。
`coalesce` はシャッフルを回避して既存のパーティションを結合(縮小)するため、パーティション数を減ら…
2026年3月8日
Structured Streamingで `trigger(availableNow=True)` を使用する主なメリットはどれか。
AvailableNowは、トリガー時点で未処理の全データを(必要なら複数のマイクロバッチに分けて)処理し、完…
2026年3月8日
DLTパイプラインで「Allowless」モード(または検知のみ)としてデータ品質を監視したい場合、適切な制約(Expectation)はどれか。
`expect` 演算子は、制約違反があった場合にイベントログに警告を記録するが、データの処理や書き込みは停…
2026年3月8日
Deltaテーブルの履歴(History)メタデータが保持されるデフォルト期間はどれか。
Delta Lakeのトランザクションログ(履歴)のデフォルト保持期間は30日である。データファイルの物理削除…
2026年3月8日
投稿のページ送り
1
…
877
878
879
…
1,206