素早く問題を解いてInput⇔Outputを繰り返し!
会員レベル
ログイン
メンバーシップアカウント
会員レベル
ログイン
メンバーシップアカウント
HOME
DevOps Institute SRE Foundation
「DevOps Institute SRE Foundation」の記事一覧
事後検証において「人間エラー(Human Error)」を根本原因とすることの問題点は何か。
「ヒューマンエラー」で思考停止せず、人がミスを犯しやすいUIや仕組みのデザイン上の欠陥を探る必要があ…
2026年3月8日
「ロールバック」とは何か。
新バージョンに不具合があった場合、即座に旧バージョンに戻してサービスを復旧させるアクション。
2026年3月8日
「フェイルオーバー(Failover)」とは何か。
アクティブなシステムがダウンした際、自動的にバックアップ(スタンバイ)システムに処理を引き継ぐ機能。
2026年3月8日
SREが重要視する「シンプリシティ(単純さ)」の理由は何か。
複雑性は信頼性の敵であり、シンプルなシステムの方が挙動を予測しやすく、維持管理が容易である。
2026年3月8日
インシデント対応における「コミュニケーション・リード」の役割は。
指揮官や作業者が対応に集中できるよう、顧客や経営陣への状況報告や問い合わせ対応を専任で行う役割。
2026年3月8日
「NoOps」の概念とSREの関係はどうか。
SREによる完全な自動化と自律システムの究極形が、人手が不要な「NoOps」の状態と言える。
2026年3月8日
「アグリゲーション(Aggregation)」とはモニタリングで何をする処理か。
膨大な生データをそのまま扱うのではなく、時間単位やサーバー単位で集約して傾向を掴む処理。
2026年3月8日
「カーディナリティ(Cardinality)」が高いメトリクスとはどのようなものか。
タグの値のバリエーション(ユニーク数)が膨大になることを高カーディナリティと呼び、モニタリングシス…
2026年3月8日
SLIの計測場所として、最もユーザー体験に近いのはどこか。
サーバー側よりも、実際にユーザーが触れているクライアント側での計測が最も実際の体験を反映する。
2026年3月8日
ポストモーテムで特定されたアクションアイテム(タスク)はどう扱うべきか。
改善タスクが忘れられないよう、通常の開発タスクと同じチケットシステムで管理し、優先度をつけて追跡す…
2026年3月8日
投稿のページ送り
1
…
10
11
12
…
85