素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv022
「Lv022」の記事一覧
`LinearRegression` モデルの学習結果から、モデルの切片(Intercept)と係数(Coefficients)を取得する属性はどれか。
Spark MLlibの線形モデル(学習済み)は `intercept`(切片、スカラー)と `coefficients`(係数、ベクト…
2026年3月8日
Feature Storeからトレーニングデータを取得する際、特定の期間(例:2023年のみ)のデータだけにフィルタリングしたい。`create_training_set` メソッドでこれを行うにはどうすればよいか。
`create_training_set` は、渡された `data` (背骨となるデータフレーム) に基づいて特徴量を結合するため…
2026年3月8日
Workflowsのジョブを、外部のイベント(例:S3へのファイル到着)をトリガーにして実行するために使用するDatabricks機能はどれか。
「File Arrival Trigger」を設定することで、指定したストレージパスに新しいファイルが作成されたことを…
2026年3月8日
Hyperoptの `SparkTrials` 使用時に、Spark UIのどこを見れば各試行(Trial)のログや進行状況を確認できるか。
Hyperoptの各試行はSparkジョブとして実行されるため、Jobsタブでジョブのステータスを確認でき、詳細なタ…
2026年3月8日
Deltaテーブルの `optimize.write` (Optimized Writes) プロパティを有効にすることのデメリット(トレードオフ)は何か。
書き込み時にシャッフルを行ってファイルサイズを最適化するため、書き込み処理自体の時間は増えるが、そ…
2026年3月8日
モニタリング設定における「Slicing(スライス)」の定義に使用できる列の条件はどれか。
スライスはデータをグループ化して分析するためのものであるため、性別、地域、バージョンなどのカテゴリ…
2026年3月8日
Databricks上で `huggingface_hub` からモデルをダウンロードして使用する場合、モデルキャッシュを永続化し、クラスタ再起動後も再ダウンロードを防ぐための推奨設定はどれか。
Hugging FaceのキャッシュディレクトリをDBFSやUnity Catalog Volumeなどの永続ストレージに向けることで…
2026年3月8日
Databricks AutoMLの時系列予測(Forecasting)において、複数の時系列(例:店舗ごとの売上)を同時に予測する「Multi-series Forecasting」を行うために必要な設定はどれか。
時系列ID列(例:store_id)を指定することで、AutoMLは単一のデータセット内の複数の系列を認識し、それ…
2026年3月8日
`BucketedRandomProjectionLSH` (Locality Sensitive Hashing) を使用する主な目的はどれか。
LSHは高次元空間において、似たようなアイテムを高い確率で同じバケットにハッシュすることで、全ペア比較…
2026年3月8日
MLflowの `log_figure` メソッドを使用して記録できるオブジェクトはどれか。
`mlflow.log_figure(fig, artifact_file)` は、MatplotlibやPlotlyのFigureオブジェクトを画像ファイルと…
2026年3月8日
投稿のページ送り
1
…
326
327
328
…
536