素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv011
「Lv011」の記事一覧
Databricks Workflowsでジョブの実行が失敗した際、原因調査のためにまず確認すべき「Job Runの詳細画面」で提供される情報はどれか。
ジョブ失敗時は、まず該当RunのUIからタスクごとのログ(Standard Output / Standard Error)およびドライ…
2026年3月8日
【シナリオ】Feature Storeでカスタム特徴量を計算する際、計算ロジック内で外部APIを呼び出す必要がある。バッチ推論のパフォーマンスへの影響を最小限にするために考慮すべき点はどれか。
推論時(特にバッチ)に外部APIを都度呼び出すとレイテンシのボトルネックになるため、事前に計算結果を中…
2026年3月8日
Hyperoptを使用してXGBoostのハイパーパラメータをチューニングする際、過学習を防ぐために探索範囲に含めるべき重要なパラメータの組み合わせはどれか。
木の深さ(max_depth)、学習率(learning_rate)、葉の最小重み(min_child_weight)、および正則化項(g…
2026年3月8日
Delta Lakeのテーブルクローン機能を使用する際、ソーステーブルのアクセス制御(ACL)設定はクローン先のテーブルに自動的に引き継がれるか。
`CLONE`コマンドはデータとメタデータ(スキーマ等)を複製するが、権限設定(Permissions/ACLs)は複製さ…
2026年3月8日
Serverless Model Servingのエンドポイントにおいて、コールドスタート(アイドル状態からの起動遅延)を最小限に抑えつつ、コストを管理するために設定すべきパラメータはどれか。
`min_provisioned_throughput`(最小プロビジョニングスループット)を0より大きく設定することで、常に最…
2026年3月8日
モニタリングアラートにおいて、「過去1時間の平均リクエスト数が、過去24時間の平均より3標準偏差以上低い」といった動的な閾値を設定したい。これに適した監視設定はどれか。
単純な数値固定ではなく、過去のトレンドに基づいた統計的な異常を検知するには、Databricks Monitoring等…
2026年3月8日
Spark DataFrameのデータをPyTorchのDataLoaderで使用する際、`num_workers`を増やすとエラーが発生する場合がある。Spark環境特有の原因として考えられるものはどれか。
PyTorchのDataLoaderが`multiprocessing`を使用する場合、Sparkの接続オブジェクトなどを子プロセスにシリ…
2026年3月8日
Databricks AutoMLの「Forecasting(時系列予測)」タスクにおいて、祝日や特定のイベント(セール期間など)の影響をモデルに考慮させるために使用できる機能はどれか。
多くの時系列予測ライブラリ(Prophet等)と同様に、AutoMLの構成においても休日や国別のカレンダー情報を…
2026年3月8日
【シナリオ】ロジスティック回帰モデルの学習時に `maxIter` に達しても収束しない(Convergence warning)という警告が出た。この問題を解決するために最初に試すべきアプローチはどれか。
勾配降下法ベースのアルゴリズムは、特徴量のスケールが異なると収束しにくくなるため、`StandardScaler`…
2026年3月8日
【シナリオ】MLflowでモデルを登録する際、モデルの推論環境がインターネットに接続できない「完全オフライン環境」である。`pip install` が走らないようにするために、モデルのデプロイ時に留意すべき点はどれか。
オフライン環境では実行時の動的なダウンロードが不可能なため、モデルサービング用のコンテナイメージに…
2026年3月8日
投稿のページ送り
1
…
876
877
878
…
1,207