素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv008
「Lv008」の記事一覧
【シナリオ】Feature Storeのテーブル `recommender_features` には `user_id` をキーとする特徴量がある。推論時に存在しない `user_id` がリクエストされた場合、Feature Lookupはどのような値を返すか。
Feature Lookup(Left Join的な動作)において、キーがFeature Store内に存在しない場合、その特徴量の値…
2026年3月8日
Hyperoptの`SparkTrials`を使用する際、並列度(同時に実行する試行数)を制御するパラメータはどれか。
`SparkTrials(parallelism=N)`のように、`parallelism`引数を使用してSparkクラスタ上で同時に実行するト…
2026年3月8日
Databricks Workflowsで、前のタスクが「成功した場合」と「失敗した場合」で異なる後続タスクを実行するような条件分岐を作成するために使用するタスクタイプはどれか。
「If/else condition」タスクタイプを使用することで、特定の条件(タスクの状態や変数値)に基づいて、次…
2026年3月8日
Unity Catalogにおいて、特定のMLモデルに対する「予測実行(Execute)」権限のみをユーザーに付与し、モデルの中身(重みなど)は見せないようにすることは可能か。
Unity Catalogでは、FunctionやModelに対して`EXECUTE`権限を付与することで、基礎となるデータやロジック…
2026年3月8日
ストリーミングデータをDeltaテーブルに書き込む際、小さなファイルが大量に生成される問題(Small File Problem)を軽減するための機能はどれか。
Auto Optimize(Optimized WritesとAuto Compaction)を有効にすることで、書き込み時にファイルサイズを…
2026年3月8日
カスタムコンテナを使用せず、標準のDatabricks Model Serving環境に追加のPythonパッケージをインストールする場合、どこに定義を追加すべきか。
モデルを`log_model`する際に、`pip_requirements`引数または`conda_env`引数で必要なパッケージリストを…
2026年3月8日
画像データの処理において、Spark DataFrame上のバイナリファイル(画像)を読み込み、デコードやリサイズなどの前処理を行うために便利なライブラリはどれか。
通常はPillowやOpenCVを使用するが、Sparkパイプライン内であればUDFと組み合わせて使用するか、あるいはM…
2026年3月8日
Databricks AutoMLによって生成されたノートブック内のコードを修正して再実行する場合、MLflow上の実験記録はどうなるか。
生成されたノートブックは標準的なMLflowコードを含んでいるため、ユーザーが実行すれば通常のMLflow Expe…
2026年3月8日
MLflow UI上で、数千の実験実行(Runs)の中から、特定のパラメータ(例:`learning_rate > 0.01`)を持つ実行のみをフィルタリングするための検索構文はどれか。
MLflowの検索バーでは、`params.`, `metrics.`, `tags.` などの構文を使用してSQLライクなフィルタリング…
2026年3月8日
線形回帰モデルにおいて、特徴量間の強い相関(多重共線性)がある場合に、モデルの安定性を高めるために有効な正則化手法を含むモデルはどれか。
Ridge(L2正則化)やLasso(L1正則化)は、係数の大きさにペナルティを課すことで過学習を防ぎ、多重共線…
2026年3月8日
投稿のページ送り
1
…
977
978
979
…
1,311