素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv020
「Lv020」の記事一覧
PROC MEANSで、データの個数(非欠損値の数)を出力する統計量キーワードはどれか。
Nキーワードは、指定した変数の非欠損オブザベーションの数を返します。
2026年3月22日
ある文字列の中に、特定の文字集合(例:数字のみ)が「含まれていないこと」を確認する関数はどれか。
NOTDIGIT関数は、最初に数字以外の文字が出現した位置を返します。
2026年3月22日
回帰モデルの評価において、平均二乗誤差(MSE)の平方根をとった指標(RMSE)を用いる主な理由はどれか。
RMSEは元のターゲット変数と同じ単位になるため、誤差の大きさを直感的に把握しやすくなります。
2026年3月21日
モデルの識別能力を評価する「Gini係数」と「AUC」の間の関係式として正しいものはどれか。
Gini係数はAUCを正規化した指標であり、ランダムなら0、完璧なら1となります。
2026年3月21日
多項式回帰(Polynomial Regression)において、次数を上げすぎた場合に発生する典型的な問題はどれか。
次数を上げすぎると訓練データのノイズにまでフィッティングし、汎化性能が極端に低下します。
2026年3月21日
CAS環境で1つのデータセットを全ワーカーノードに完全に複製して配置する状態を何と呼ぶか。
Duplicated(またはReplicated)テーブルは、小さなテーブルを大きなテーブルと結合する際に効率的です。
2026年3月21日
Model Studioでパイプラインを「自動生成(Automated Pipeline)」する機能が利用する技術はどれか。
AutoML機能は、データの特性に合わせて最適なノード構成とパラメータを自動で選定します。
2026年3月21日
変数の平均を0、標準偏差を1に変換する標準化(Z-score)において、外れ値はどう扱われるか。
標準化はスケーリングを行いますが、外れ値そのものを除去したり抑制したりする機能はありません。
2026年3月21日
CASLにおいて、アクションの結果得られたテーブル型のデータをループで処理するために用いる文はどれか。
DO OVER文を使用すると、アクション結果のリストや辞書の内容を効率的に反復処理できます。
2026年3月21日
2つの名義型変数の間に統計的な関連性があるかどうかを判定するために用いられる検定はどれか。
カイ二乗検定(Chi-square test)は、分割表を用いてカテゴリ間の独立性を検証します。
2026年3月21日
投稿のページ送り
1
…
453
454
455
…
976