素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
Lv012
「Lv012」の記事一覧
SREを組織に導入する際、最初にSREチームを作るべき対象は。
SREの価値を証明し効果を最大化するため、ビジネスへの影響が大きく、かつ信頼性の課題があるシステムから…
2026年3月8日
「猶予期間(Grace Period)」とはモニタリングにおいて何か。
一時的なスパイクで即アラートを出さないよう、状態が一定時間継続して初めて異常とみなす期間設定。
2026年3月8日
「カナリアリリース」で自動ロールバックを設定する基準は通常何か。
新バージョンの指標(エラー率など)が悪化したことを検知したら、人手を介さず自動的に旧バージョンに戻…
2026年3月8日
ポストモーテム・レビュー会議の主な目的は。
作成されたレポート内容を関係者で確認し、事実関係の正確さとアクションアイテムの妥当性を承認・共有す…
2026年3月8日
「カスケード障害」とは何か。
あるノードのダウンによる負荷が他へ移動し、それもダウンして...と連鎖的に広がる大規模障害。
2026年3月8日
SREにおける「自動化」の段階として、手動実行から自律システムへの進化をなんと呼ぶか。
手作業→スクリプト化→外部トリガー→自己修復といったように、自動化の成熟度が上がっていく概念。
2026年3月8日
「シンセティックモニタリング(Synthetic Monitoring)」とは。
スクリプトにより定期的に模擬アクセスを行い、死活監視やパフォーマンス測定を行う手法(外形監視)。
2026年3月8日
「オンコールローテーション」の設計で避けるべきことは。
頻繁すぎる交代は引き継ぎ負荷を増やし、長すぎる担当は疲労を招くため、適切な期間(1週間など)で回す。
2026年3月8日
「トイルの削減」自体がトイルになってはいけない。これを防ぐにはどうするか。
自動化作業自体も工数がかかるため、ROI(投資対効果)を見極め、プロジェクトとして正式に管理する。
2026年3月8日
「CUJ (Critical User Journey)」とは何か。
サービスにおいてビジネス上最も重要で、ユーザーが頻繁に行う一連の操作手順(買い物、動画再生など)の…
2026年3月8日
投稿のページ送り
1
…
886
887
888
…
1,224