素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv028
「Lv028」の記事一覧
【シナリオ】企業全体のMLflow Tracking Serverを中央集権化(Centralized)しており、数千人のユーザーがいる。特定の機密プロジェクトの実験記録だけは、他のプロジェクトのメンバーから完全に見えないようにしたい。どう構成すべきか。
実験(Experiment)単位でAccess Control List (ACL) を設定できるため、特定のユーザー/グループのみにRe…
2026年3月8日
【シナリオ】ジョブAの完了後にジョブBを実行したいが、ジョブAとBは異なるDatabricksワークスペースにある。これを自動化する方法はどれか。
ワークスペースを跨ぐオーケストレーションはネイティブの依存関係では設定できないため、API呼び出しを行…
2026年3月8日
【シナリオ】Feature Storeにおいて、複数のモデルが同じ特徴量を使用しているが、あるモデルには「欠損値を平均で埋めたもの」、別のモデルには「欠損値を-1で埋めたもの」を提供したい。推奨される設計はどれか。
Feature Storeは「共有・再利用」を目的としているため、前処理の方針が異なる場合は、定義段階で別の特徴…
2026年3月8日
【シナリオ】Deltaテーブルの `Z-Order` 最適化を行いたいが、テーブルには数百の列がある。どの列をZ-Orderの対象に選ぶべきかの基準は何か。
Z-Orderは多次元のデータ局所性を高める技術だが、次元数(列数)が増えると効果が薄れるため、クエリパタ…
2026年3月8日
【シナリオ】Hyperoptの探索空間として、整数値のパラメータ(例:決定木の深さ)を探索したいが、`hp.quniform` はfloat型を返すため、モデルによっては型エラーになる。どう対処すべきか。
`hp.quniform` の戻り値は浮動小数点数(例:5.0)であるため、整数を期待するライブラリ(sklearnのmax_d…
2026年3月8日
【シナリオ】Model Servingエンドポイントに対して、インターネット経由ではなく、VPC内部(Databricksワークスペースと同じネットワーク内)からプライベートにアクセスさせたい。これを実現する機能はどれか。
AWS PrivateLinkやAzure Private LinkをサポートするDatabricks構成(Serverless Compute planeへの接続設…
2026年3月8日
【シナリオ】モニタリングの結果、ドリフトが検知されたが、再学習が必要かどうか判断がつかない。ビジネス部門に判断を仰ぐために、ドリフトした具体的なデータ例を抽出して提示したい。どうすればよいか。
Lakehouse MonitoringのバックエンドはInference Table(Delta Table)であるため、SQLを使用して特定の期…
2026年3月8日
【シナリオ】画像セグメンテーションタスクにおいて、マスク画像(正解ラベル)のデータ拡張(Augmentation)を行う際、入力画像と同じ変換(回転や反転)を適用する必要がある。これを保証する方法はどれか。
セグメンテーションでは入力と正解のピクセル対応が崩れてはいけないため、`tf.image` や `albumentations…
2026年3月8日
【シナリオ】Databricks AutoMLの分類タスクで、特定のクラス(例:「不正解」)の再現率(Recall)を最大化することを最優先したい。AutoMLの設定でこれを直接指定できない場合、どうすべきか。
AutoMLは汎用的な指標(F1, Accuracy等)で最適化するため、特定のビジネスKPI(特定クラスのRecall重視な…
2026年3月8日
【シナリオ】MLflowのRun IDを知っている状態で、そのRunで記録されたすべてのパラメータとメトリクスをPython辞書として一括取得したい。どのメソッドを使用すべきか。
`mlflow.get_run(run_id)` は `Run` オブジェクトを返し、その `data` 属性(`RunData`)には `params`, `…
2026年3月8日
投稿のページ送り
1
…
140
141
142
…
294