素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv012
「Lv012」の記事一覧
MLflowの実験画面(Run Detailページ)で確認できる「Artifacts」に含まれないものはどれか。
標準出力は通常Driverログに記録されるものであり、Artifactsとして明示的にファイル保存しなければここに…
2026年3月8日
Databricks Jobsにおいて、複数のタスク(Notebook, Jar等)を順序立てて実行するための機能はどれか。
Jobsでは、タスクAが成功したらタスクBを実行する、といった依存関係をDAG(有向非巡回グラフ)として定義…
2026年3月8日
AutoMLがデータセット内の欠損値(Null)に対してデフォルトで行う処理はどれか。
AutoMLは前処理ステージを含んでおり、情報の損失を防ぐために適切な戦略で欠損値を自動補完する。
2026年3月8日
Webhookを使用してモデルの遷移時に通知を送る際、セキュリティを確保するために使用されるトークンは何と呼ばれるか。
Webhookのペイロード署名を検証するために、共通のシークレット(Secret)を設定し、受信側で真正性を確認…
2026年3月8日
Delta LakeのTime Travel機能で遡れる期間は、何によって制限されるか。
`VACUUM`コマンドを実行すると保持期間外の古いデータファイルが物理削除され、それ以前へのTime Travelは…
2026年3月8日
`StringIndexer`を使用する際、学習データには存在しなかったカテゴリがテストデータに出現した場合のエラーを防ぐ設定はどれか。
デフォルトはエラーになるため、"skip"(行を削除)や"keep"(特別なバケットに割り当て)を設定して未知…
2026年3月8日
Feature Store Clientの`write_table`メソッドにおける`mode`パラメータで、’merge’を指定するとどうなるか。
'merge'モードは、新しいデータで既存の特徴量値を更新したり、新規エンティティを追加したりする場合に使…
2026年3月8日
Hyperoptの`SparkTrials`を使用する際、並列度(parallelism)を高く設定しすぎると発生する可能性がある問題は何か。
過度な並列化はスケジューリングのオーバーヘッドや通信コストを増大させ、逆にパフォーマンスを悪化させ…
2026年3月8日
学習したモデルをMLflowに保存し、後でロード可能な状態にするための関数はどれか。
`log_model`関数は、指定されたフレームワークのモデルをMLflowの標準フォーマットで保存し、Artifactとし…
2026年3月8日
Pandas API on Spark (`pyspark.pandas`) を使用する際、標準のPandasと異なり注意すべき点は何か。
分散処理の特性上、行の順序は保証されず、順序に依存する操作には明示的なソートが必要になる場合がある。
2026年3月8日
投稿のページ送り
1
…
891
892
893
…
1,221