素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
DevOps Institute SRE Foundation
「DevOps Institute SRE Foundation」の記事一覧
根本原因分析(RCA)の手法としてよく用いられる「5 Whys」とは何か。
表層的な原因ではなく、深層にある真の原因(プロセスや仕組みの欠陥)にたどり着くために「なぜ」を繰り…
2026年3月8日
「ダークローンチ(Dark Launching)」とはどのような手法か。
UIには表示せず、バックエンドで新コードを実行し、実際のトラフィックで負荷やエラーを確認する手法。
2026年3月8日
「サーキットブレーカー」パターンの役割は何か。
依存サービスがダウンしている時に、リクエストを送り続けてリソースを浪費するのを防ぎ、即座にエラーを…
2026年3月8日
時系列データにおいて「外れ値(Outlier)」を検知することの重要性は何か。
ロードバランシングされた環境などでは、平均値は正常でも特定の1台だけが異常な場合があり、外れ値検知が…
2026年3月8日
「可観測性」がないシステムに対してSREができることは何か。
計測できないものは改善できないため、まずはシステムにメトリクスやログを仕込み、現状を把握することか…
2026年3月8日
「トイルの50%キャップ」を超えたトイルが発生した場合、Googleではどう対応するか。
SREのリソースを守るため、上限を超えた運用負荷は開発チーム自身に担当させ、開発チームに信頼性向上のイ…
2026年3月8日
「ホイール・オブ・ミスフォーチュン(Wheel of Misfortune)」とは何か。
実際の過去の障害事例などを使い、オンコール担当者がシミュレーション訓練を行う教育手法。
2026年3月8日
「稼働率99.9%」の場合、1ヶ月(30日)あたりの許容ダウンタイムは約どれくらいか。
30日 × 24時間 × 60分 = 43,200分。その0.1%は約43分である。
2026年3月8日
エラーバジェットポリシーに違反した場合の「凍結(Freeze)」措置の対象は通常何か。
信頼性を回復するため、リスクを伴う「新機能のリリース」を凍結し、安定性向上の変更のみを許可する。
2026年3月8日
トレース(Tracing)が特に有効なシステムアーキテクチャはどれか。
マイクロサービスなどの分散システムでは、1つのリクエストが複数のサービスを通過するため、処理の流れを…
2026年3月8日
投稿のページ送り
1
…
12
13
14
…
85