素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv008
「Lv008」の記事一覧
SREチームの評価指標として不適切なものはどれか。
チケット数が多いことはシステムが不安定であるかトイルが多いことを意味するため、単に処理数が多いこと…
2026年3月8日
エラーバジェットを消費することは「悪いこと」か。
エラーバジェットは「使うための予算」であり、範囲内であればリリース速度を上げるなど有効活用すべきも…
2026年3月8日
根本原因分析(RCA)の手法としてよく用いられる「5 Whys」とは何か。
表層的な原因ではなく、深層にある真の原因(プロセスや仕組みの欠陥)にたどり着くために「なぜ」を繰り…
2026年3月8日
「ダークローンチ(Dark Launching)」とはどのような手法か。
UIには表示せず、バックエンドで新コードを実行し、実際のトラフィックで負荷やエラーを確認する手法。
2026年3月8日
「サーキットブレーカー」パターンの役割は何か。
依存サービスがダウンしている時に、リクエストを送り続けてリソースを浪費するのを防ぎ、即座にエラーを…
2026年3月8日
時系列データにおいて「外れ値(Outlier)」を検知することの重要性は何か。
ロードバランシングされた環境などでは、平均値は正常でも特定の1台だけが異常な場合があり、外れ値検知が…
2026年3月8日
「可観測性」がないシステムに対してSREができることは何か。
計測できないものは改善できないため、まずはシステムにメトリクスやログを仕込み、現状を把握することか…
2026年3月8日
「トイルの50%キャップ」を超えたトイルが発生した場合、Googleではどう対応するか。
SREのリソースを守るため、上限を超えた運用負荷は開発チーム自身に担当させ、開発チームに信頼性向上のイ…
2026年3月8日
「ホイール・オブ・ミスフォーチュン(Wheel of Misfortune)」とは何か。
実際の過去の障害事例などを使い、オンコール担当者がシミュレーション訓練を行う教育手法。
2026年3月8日
「稼働率99.9%」の場合、1ヶ月(30日)あたりの許容ダウンタイムは約どれくらいか。
30日 × 24時間 × 60分 = 43,200分。その0.1%は約43分である。
2026年3月8日
投稿のページ送り
1
…
974
975
976
…
1,317