素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
DevOps Institute SRE Foundation
「DevOps Institute SRE Foundation」の記事一覧
「カナリアリリース」で自動ロールバックを設定する基準は通常何か。
新バージョンの指標(エラー率など)が悪化したことを検知したら、人手を介さず自動的に旧バージョンに戻…
2026年3月8日
ポストモーテム・レビュー会議の主な目的は。
作成されたレポート内容を関係者で確認し、事実関係の正確さとアクションアイテムの妥当性を承認・共有す…
2026年3月8日
「カスケード障害」とは何か。
あるノードのダウンによる負荷が他へ移動し、それもダウンして...と連鎖的に広がる大規模障害。
2026年3月8日
SREにおける「自動化」の段階として、手動実行から自律システムへの進化をなんと呼ぶか。
手作業→スクリプト化→外部トリガー→自己修復といったように、自動化の成熟度が上がっていく概念。
2026年3月8日
「シンセティックモニタリング(Synthetic Monitoring)」とは。
スクリプトにより定期的に模擬アクセスを行い、死活監視やパフォーマンス測定を行う手法(外形監視)。
2026年3月8日
「オンコールローテーション」の設計で避けるべきことは。
頻繁すぎる交代は引き継ぎ負荷を増やし、長すぎる担当は疲労を招くため、適切な期間(1週間など)で回す。
2026年3月8日
「トイルの削減」自体がトイルになってはいけない。これを防ぐにはどうするか。
自動化作業自体も工数がかかるため、ROI(投資対効果)を見極め、プロジェクトとして正式に管理する。
2026年3月8日
エラーバジェットの残量が十分にある場合、SREチームは何をすべきか。
信頼性が十分なら、その余裕を使って開発効率を上げるためのツール整備や自動化に時間を投資するのが建設…
2026年3月8日
「CUJ (Critical User Journey)」とは何か。
サービスにおいてビジネス上最も重要で、ユーザーが頻繁に行う一連の操作手順(買い物、動画再生など)の…
2026年3月8日
ポストモーテムにおける「根本原因」は一つだけか。
現代の複雑なシステムにおいて、単一の原因で障害が起きることは稀であり、複数の要因が重なって発生する。
2026年3月8日
投稿のページ送り
1
…
8
9
10
…
85