Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
sliの人気記事 44件 - はてなブックマーク
[go: Go Back, main page]

並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 44件

新着順 人気順

sliの検索結果1 - 40 件 / 44件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

sliに関するエントリは44件あります。 SRESLO運用 などが関連タグです。 人気エントリには 『SLI/SLO 完全ガイド - CyberAgent SRG #ca_srg』などがあります。
  • SLI/SLO 完全ガイド - CyberAgent SRG #ca_srg

    メディア統括本部 サービスリライアビリティグループ(SRG)の長谷川 @rarirureluis です。 #SRG(Service Reliability Group)は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。 本記事は、SRE としてチームへ参加した時に SLI/SLO をチーム内で浸透を行うまでのステップを具体的な資料やテンプレートを用いて説明した社内向け資料を、いくらか情報を制限してご紹介します。

      SLI/SLO 完全ガイド - CyberAgent SRG #ca_srg
    • PairsにおけるSLI/SLO再定義

      https://sre-lounge.connpass.com/event/227250/

        PairsにおけるSLI/SLO再定義
      • SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク

        1. はじめに こんにちは、「信頼性は可用性ではない」を標語にしているnwiizoです。 近年、サービスの信頼性向上に向けた取り組みとして、SLI(Service Level Indicator)、SLO(Service Level Objective)、エラーバジェットという概念が注目を集めています。これらは、Google発祥のSRE(Site Reliability Engineering)プラクティスの中核をなす考え方であり、多くの組織がこのアプローチを採用し始めています。また、関連するツールも成熟し始めており、実践的な導入がより容易になってきています。 本ガイドでは、SLI、SLO、エラーバジェットを導入する前に知っておくべき重要なポイントについて詳細に解説します。各概念の定義から実践的な導入ステップ、さらには組織文化の変革まで、包括的な情報を提供します。 2. SREにおける基本

          SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク
        • クリティカルユーザージャーニーを利用した SLI/SLO の改善 / #mackerelio

          Introduction to Sansan, inc / Sansan Global Development Center, Inc.

            クリティカルユーザージャーニーを利用した SLI/SLO の改善 / #mackerelio
          • SREエンジニアのSLI/SLO導入への挑戦 - ぐるなびをちょっと良くするエンジニアブログ

            こんにちは。データ・AI戦略部 SREチームの小野です。2020年8月に入社してから早3年。SREエンジニアとして、日々業務改善に励んでいます。 ここ一年ほど、DAOという組織改善プロジェクトを推進してきました。このプロジェクトは組織内で発生するあらゆるイベントを「機能」として定義・実装し、それらを束ねてサービスとして組織内外に提供するプロジェクトです。 ※ 詳細はSREエンジニアが組織改善プロジェクトを立ち上げてみたを参照ください これまでの通常業務をサービスとして提供するという考え方は、我ながらとてもユニークかつ俊逸な発想だったと感じています。なぜなら、このサービスベースな考え方により組織にSLI/SLOを導入しやすくなったためです。 SLI/SLOの導入は個人的に難しいと考えています。導入するためにはさまざまな「ハードル」を突破する必要があるためです。しかし一方で、SLI/SLOを導

              SREエンジニアのSLI/SLO導入への挑戦 - ぐるなびをちょっと良くするエンジニアブログ
            • SLI/SLO運用の実践 shimesabaによる指標モニタリング - KAYAC Engineers' Blog

              カヤックSREの池田です。 先月は、カヤックのプロダクトの一つ『Tonamel』で導入したエラーバジェット算出ツール『shimesaba』の話をしました。 techblog.kayac.com github.com 今回は、実際にどのようにSLI/SLOを運用しているのか?という内容をshimesabaを使った設定例を交えつつ話します。 SLI/SLOの運用にお悩みの方の助けになれば幸いです。 最初のSLI/SLOはどう決定したのか? SLI/SLOの運用を始めるにあたって、多くの人が悩むのは以下の2つだと思います。 一体何をSLIとすれば良いのか? 最初のSLOはどのくらいにしたら良いのか? つまりは、最初の1歩をどうしたら良いか?と言う話ですが、こちらに関しては2つ参考になるものがあります。 『SLO決定のためのArt of SLO』 https://sre-next.dev/2022

                SLI/SLO運用の実践 shimesabaによる指標モニタリング - KAYAC Engineers' Blog
              • 我々はこうしてSLI/SLOを設計し 運用を始めました  -これからSLI/SLOの運用を始める人に向けて-

                SRE大集合!みんなで学ぶ、信頼性を高めるための取り組みLT大会の登壇資料です。 概要 つい先日SLI/SLOの設計が終わりSLOの運用をスタートしましたがそれまでの道のりは楽ではありません…

                  我々はこうしてSLI/SLOを設計し 運用を始めました  -これからSLI/SLOの運用を始める人に向けて-
                • DMMプラットフォームに ゼロベースでSLO導入している取り組み 適切なSLI模索の軌跡

                  ゼロベースでSLOの存在意義はなにか?適切なSLIはどうやって決めるのか?を考察・調査し、まずはプラットフォームの一部のチームでSLOを策定しました。それまでの苦労を含めてSLOがなぜ必要か、またSLIをどのように決めたのか等お話します。 Cloud Operator Days Tokyo 2023で…

                    DMMプラットフォームに ゼロベースでSLO導入している取り組み 適切なSLI模索の軌跡
                  • サービスの一般公開前からSLI/SLOと向き合う - Hatena Developer Blog

                    Mackerel チームで SRE を担当している id:taxintt と申します。 はてなの SRE が毎月交代でブログ記事を書く Hatena Developer Blog の SRE 連載、3月分は私が担当します。2月の記事は id:masayosu さんの はてなにおけるEKSの運用と自動化 (2024年版) でした。 私が所属する Mackerel 開発チームでは、SaaS 型サーバー監視サービスである Mackerel を開発しています。 Mackerel は、テレメトリデータの計装・収集の標準化を目的としたプロジェクトである OpenTelemetry 対応のための開発を進めています。この記事では、OpenTelemetry のメトリックを扱うサブシステムの開発における SLI/SLO の決定・運用についてお話しします。 mackerel.io OpenTelemetry

                      サービスの一般公開前からSLI/SLOと向き合う - Hatena Developer Blog
                    • インフラの整備、SLIとSLOの設定、セール対策 Railsアプリケーションのユーザ体験を支えるSREの取り組み | ログミーBusiness

                      オリジナルグッズ作成・販売サービス「SUZURI byGMOペパボ」に関わるエンジニアメンバーや事業部長が登壇し、SUZURIの開発の今や、現在の課題・今後の取り組みについて話す「43万人超のクリエイターの表現活動を支える!ECプラットフォームSUZURIの開発の裏側」。ここでモバイル/Webアプリケーションエンジニアの時田氏が登壇。SRE活動として行っていることを紹介します。 自己紹介と今日話すこと時田理氏(以下、時田):「SUZURIにおけるSREの取り組み」というタイトルで発表します。よろしくお願いします。自己紹介です。「SUZURI」というサービスのモバイルと、Webアプリケーションエンジニアをやっています。 今日話すことです。すみません、最初におことわりなんですけど、最初の仮のタイトルではFlutterに関する登壇をする予定だったんですが、今日はちょっとFlutterの話はしない

                        インフラの整備、SLIとSLOの設定、セール対策 Railsアプリケーションのユーザ体験を支えるSREの取り組み | ログミーBusiness
                      • SLI/SLOの設定を進めるその前に、アラート品質の改善に取り組んだ話 - BASEプロダクトチームブログ

                        本記事はBASEアドベントカレンダー2024の14日目の記事です。 はじめに BASE の Product Dev Division でエンジニアリングマネージャー(EM)をしている @tanden です。 Product Dev Division では、ここ 1 年ほどサービスレベルマネジメントの取り組みを有志メンバーを中心としたチームで進めてきました。この記事では、サービスレベルマネジメントの取り組みの一貫として行ったアラート品質改善についてまとめています。 SLI/SLO設定のその前に サービスレベルマネジメント(SLM)というと SLI/SLO について最初に思い浮かぶ方も多いのではないでしょうか。ただ、SLI/SLO の設定にトライされたことがある方はご理解いただけると思いますが、組織として納得感を持ってかつ効果的な形で設定するのは非常に難しい作業になります。また一度設定して終わ

                          SLI/SLOの設定を進めるその前に、アラート品質の改善に取り組んだ話 - BASEプロダクトチームブログ
                        • Mackerelを使ったSLI/SLOによるサービス運用の紹介 - Mackerel ブログ #mackerelio

                          この記事では、Mackerelを使ったSLI/SLOによるサービス運用を紹介します。 SLI/SLOとは何か SLIの実装 SLOの設定 エラーバジェットとは さらに詳しく知るには MackerelでのSLI/SLO運用 SLI/SLOを策定する 可用性の計測 レイテンシの計測 ダッシュボードで定期的に状況を確認する 式による監視でモニタリングする SLI/SLOを運用と開発に活用するためには まとめ SLI/SLOとは何か SLI(Service Level Indicator)とはユーザーに提供したいサービスのレベル(水準)を計測する指標であり、SLO(Service Level Objective)とはSLIの目標値です。 サービスレベルを適切に定め、その指標(SLI)を実装・計測し、設定した目標値(SLO)を満たしているかどうかを定期的に確認することで、サービスレベルを適切に改善す

                            Mackerelを使ったSLI/SLOによるサービス運用の紹介 - Mackerel ブログ #mackerelio
                          • ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと

                            https://yuru-sre.connpass.com/event/317749/ 登壇資料

                              ゆるっと話すSLI/SLOを設定してよかったこと出来ていないこと
                            • Grafana,Prometheus,Slothで実現するSLI/SLO管理入門:Slothの裏側を探るPromQL解読ガイド [DeNA インフラ SRE] | BLOG - DeNA Engineering

                              2025.10.21 技術記事 Grafana,Prometheus,Slothで実現するSLI/SLO管理入門:Slothの裏側を探るPromQL解読ガイド [DeNA インフラ SRE] by yuto.ota #infrastructure #sre #grafana #prometheus #sloth はじめに サービスの信頼性を定量的に評価し、管理するためのSLI/SLO。その実現方法には、高機能なSaaS製品を利用する方法もあれば、PrometheusやGrafanaといったオープンソースソフトウェア(OSS)を組み合わせて構築する方法もあります。特に、コスト面の制約や、既にGrafanaなどの監視基盤が稼働している環境では、後者を選択するケースも少なくありません。 しかし、PrometheusとGrafanaでSLI/SLO管理を実現しようとすると、一つの大きな壁に突き当た

                                Grafana,Prometheus,Slothで実現するSLI/SLO管理入門:Slothの裏側を探るPromQL解読ガイド [DeNA インフラ SRE] | BLOG - DeNA Engineering
                              • MackerelでSLI/SLO運用をする際に役立つ機能やツールの紹介 - Mackerel ブログ #mackerelio

                                この記事は Mackerel Advent Calendar 2021 の17日目の記事です。 Mackerel SREチームのid:masayoshi です。 今回はAWS ECSとALBで構築したWebアプリケーションを例に、Mackerelを利用したSLI/SLOの設定、運用改善に利用できる機能やツールを紹介したいと思います。 今回紹介する機能やツールの概要図です。 ALB+ECS環境とMackerel まずは、ECSで動いているWebアプリケーションのSLI/SLOを考えていきましょう。 最初から複雑なSLI/SLOを設定、実装するのは難しいため、簡単に取得できるメトリックや監視設定から運用を始めていき、徐々に監視を改善していくことをおすすめします。 ここでは、以下のようなSLI/SLOを設定したと仮定して、メトリックの取得する方法など見ていきましょう。 レイテンシー HTTPレス

                                  MackerelでSLI/SLO運用をする際に役立つ機能やツールの紹介 - Mackerel ブログ #mackerelio
                                • SLI/SLO・ラプソディあるいは組織への適用の旅

                                  こんにちは、花粉症が辛いです。登壇する時にくしゃみしないために朝から外出を自粛してます。15分なのにスライドが40枚あります。 本日、「信頼性向上の第一歩!~SLI/SLO策定までの取り組みと運用事例~」というイベントで「SLI/SLO・ラプソディあるいは組織への適用の旅」🎵🧭 というタイトル…

                                    SLI/SLO・ラプソディあるいは組織への適用の旅
                                  • SREとしてSLI_SLOをどう普及してきたか、CTOとしてSLI_SLOをどう活用しているか | ドクセル

                                    SREとしてSLI/SLOをどう普及してきたか、 CTOとしてSLI/SLOをどう活用しているか 株式会社ユーザベース 安藤裕紀 2025.3.21 信頼性向上の第一歩!~SLI/SLO策定までの取り組みと運用事例~ 00 自己紹介 安藤裕紀 / Yuki Ando 株式会社ユーザベース 執行役員 NewsPicks CTO NewsPicksの技術責任者 兼 広告事業の開発チームリーダー 2022/7〜2025/2までの約3年間はSREチームリーダーをやっていました 特技:AWSコスト削減や障害対応を愚直に100本ノックすること 好きなSREのプラクティス:非難なきポストモーテム文化 Incident Response Meetupという障害対応のイベントを運営しています ©Uzabase, Inc. All Rights Reserved.

                                      SREとしてSLI_SLOをどう普及してきたか、CTOとしてSLI_SLOをどう活用しているか | ドクセル
                                    • SLI/SLO の導入経緯と導入後に起きた変化

                                      デベロッパーのためのクラウド活用方法 SLI/SLO の導入経緯と導入後に起きた変化 2025-10-02 | Author : 目賀田 裕人 (千株式会社) 千株式会社 ものづくり部コンシューマー開発グループの目賀田です。 保育園・幼稚園・学校の写真撮影・販売をトータルでサポートするインターネット写真サービスを提供する「はいチーズ!フォト」の、保護者様向け写真販売サイトの開発・運用を担当しています。 はいチーズ! フォトの写真販売サイトには、お子様の通う園・学校の年間行事実施に合わせて大きなトラフィックが発生します。 それに合わせてサービスにかかる負荷が高くなり、ユーザー体験を大きく損ねるような障害が起きていました。 そこで、ユーザーの体験を守るため、また、もしユーザーの体験を損ねた場合もすぐにリカバーできるようにするため、カスタマーサポートチームと連携して SLI/SLO を設定し、約

                                      • SREの実践、SLI/SLO策定までの道のり - Qiita

                                        この記事はエイチーム引越し侍/エイチームコネクトの社員による、Ateam Hikkoshi samurai Inc.× Ateam Connect Inc. Advent Calendar 2021 8日目の記事です。 8日目は、エイチームグループ内でもレアキャラなインフラエンジニアの @sugoto911 が担当します。 趣味はカメラ、登山、キャンプです! 今年も雪が多いようなので、これからの季節はスキーを楽しみたい所存です。 来世は長野県松本市在住の山ガール予定なので、生暖かい目で見守っていただけると嬉しいです 仕事では**「推測するな、計測せよ」**をモットーに、日々インフラの管理や監視、Observabilityの整備を行っています。 はじめに 私がSREという方法論に出会ったのは、まだエイチーム引越し侍に入社前の2018年頃です。 当時はそもそも「信頼性とはなんぞ・・・?」という

                                          SREの実践、SLI/SLO策定までの道のり - Qiita
                                        • 『スタディサプリ』における SLI/SLO の継続的改善 / Continuous improvement of SLI/SLO at StudySapuri

                                          https://connpass.com/event/282120/

                                            『スタディサプリ』における SLI/SLO の継続的改善 / Continuous improvement of SLI/SLO at StudySapuri
                                          • 信頼性向上のためのSLI/SLO導入vol.2 - プラットフォームへの導入事例

                                            This post is also available in the following languages. English, Korean, Chinese はじめに こんにちは。Enablement EngineeringチームでSRE(site reliability engineer)業務を担当しているDahee Eoです。 私たちのチームは、LINEサービスをより高性能で効率的かつ安全にユーザーへ提供できるよう、さまざまな面から「Enablement」をサポートする役割を担っています。具体的には、メディアプラットフォームのサイト信頼性エンジニアリング(site reliability engineering)に加え、トラフィックの起点となるGSLB(global server load balancing)とCDN(content delivery network)に関する業務

                                              信頼性向上のためのSLI/SLO導入vol.2 - プラットフォームへの導入事例
                                            • コインチェックでSLI/SLOを策定したときの話 - Coincheck Tech Blog

                                              Introduction はじめまして、SRE G の渡邉です。今回のブログでは、以前の弊社 VP of Engineering佐藤によるコインチェックでの DX Criteria の活用 https://tech.coincheck.blog/entry/2021/12/13/115048 にあった「SLI/SLO/エラーバジェットの決定」の話をします。 コインチェックでは、策定にあたってこんなことを考えて、こんな 感じのものを策定した、を紹介しますので、皆様のSLO策定・改善の役に立てていただけると幸いです 策定の経緯 SREとしてトイル削減やアラート整理などは進めていたのですが、それがある程度落ち着いてきてからは、SLOの策定はやらないといけないとは思いつつもその必要性から説明をしてつくっていくのは相当なパワーを使うのでなかなか手を付けられていませんでした。 それが、2020年の末あ

                                                コインチェックでSLI/SLOを策定したときの話 - Coincheck Tech Blog
                                              • SLI/SLO文化を組織に浸透させる! 〜プロダクト憲章作成から始める4ステップ〜 - DMM inside

                                                “爆速” 導入の舞台裏!デジタル庁が提供する「デジタル認証アプリ」の活用で実現「安全で簡単な本人確認システム」

                                                  SLI/SLO文化を組織に浸透させる! 〜プロダクト憲章作成から始める4ステップ〜 - DMM inside
                                                • よりUXに近いSLI・SLOの運用による可用性の再設計

                                                  SRE NEXT 2022 https://sre-next.dev/2022/schedule/#jp47

                                                    よりUXに近いSLI・SLOの運用による可用性の再設計
                                                  • しんどくないSLI/SLOプラクティスをNew Relicで?

                                                    はじめに こんにちは、情報システム部 SRE 橋本です。 今回はQiitaのNew Relic Advent Calendar 2023の14日めの記事として書きました。 担当しているシステムでサービス監視やSLI/SLOを用いて、どのようにしてサービスの健全性を知るのか?というのを考えていく中でNew Relicが課題解決に繋がるかもしれないと思い、直近でチームで評価を行いました。 この記事では、どのような課題感を持っていたのかというのと、その課題感に対して当該プロダクトがどう刺さったのかを簡単にお話したいと思います。 サービスとその信頼性 BtoBやBtoCなどで違いはあると思いますが、サービスがあり(中央)、サービスの提供者(下)、サービスを利用するお客様などの利用者(上)という3つの関係性で整理できます。 この関係性の中で、我々は利用者が正常にサービスを利用できているかを知りたいと

                                                      しんどくないSLI/SLOプラクティスをNew Relicで?
                                                    • SLI/SLO、「完全に理解した」から「チョットデキル」へ

                                                      at https://sre-lounge.connpass.com/event/381852/

                                                        SLI/SLO、「完全に理解した」から「チョットデキル」へ
                                                      • SRE NEXT 2024でクライアントサイドへのSLI/SLOの導入についてお話しました

                                                        はじめに LuupのSREチームに所属している、ぐりもお(@gr1m0h)です。 日本最大のSREカンファレンス SRE NEXT 2024 に登壇しました。このカンファレンスはSRE Loungeの運営メンバーが主体となって運営しており、今回で4回目の開催です。 私の登壇の題は「Enabling Client-side SLO」です。これまでの「Enabling SLO」の活動の一環として、クライアントサイド(iOS・Android)のSLOのを計測し始めた話を共有しました。「Enabling SLO」とは、各開発チームがSREを実践し、SLI/SLOを自律的に設計・実装・運用できるようにする活動です。 登壇では、AndroidやiOSの開発チームとプロダクトマネージャーと共に、クライアントサイドのSLOの運用を始めるまでの意思決定や課題について共有しました。まさに 「信頼性は会話です」

                                                          SRE NEXT 2024でクライアントサイドへのSLI/SLOの導入についてお話しました
                                                        • バクラクシリーズの DevOps チームの取り組み~CUJ/SLI 策定のご紹介~ - LayerX エンジニアブログ

                                                          この記事は、6月から始まっている #LXベッテク月間 13日目の記事です。 昨日は @michiru_da さんの 【すぐできる】LayerX カスタマーサクセスチームのBet Technology施策でした 📝 CS チームの Bet Technology な取組みが紹介されているので見てない方はぜひご覧ください! こんにちは、LayerXで バクラクシリーズ のインフラを担当している DevOps チーム の多田(@tada_infra)です。私が所属する DevOps チームは今年から組成されたことで、チームとして取り組みを推進できるようになりました。この記事では DevOps チームの直近の取り組みをご紹介します。 DevOps チームの役割とロードマップの作成 お客様の体験を損なわないために CUJ と SLI の検討 まとめ We are Hiring!!! DevOps チ

                                                            バクラクシリーズの DevOps チームの取り組み~CUJ/SLI 策定のご紹介~ - LayerX エンジニアブログ
                                                          • Monitoring user experience 
of Flutter apps with SLI/SLO (日本語)

                                                            こちらは 2024年6月に https://flutterninjas.dev/ で登壇した資料です。 SLI/SLO is often heard as a SRE word, but it is not familiar to mobile app development. In my pro…

                                                              Monitoring user experience 
of Flutter apps with SLI/SLO (日本語)
                                                            • アラート対応やSLI/SLO、エラーバジェットの運用を学ぼう (2024/01/30 19:00〜)

                                                              アラート対応やSLI/SLO、エラーバジェットの運用を学ぼう! 今回は「チームとコミュニティで監視を育てる」をテーマに、SREのはじめ方やシステムの信頼性、SLI/SLO、エラーバジェットの運用方法、アラート対応などが学べるトークやパネルディスカッションをお届けしたMackerel Meetup #15をふりかえるコンテンツをご用意しています。奮ってご参加ください! 下記の開催レポートを事前にお読みいただいた上でご参加いただくとよりお楽しみいただけます(一部を抜粋します) 【開催レポート】チームとコミュニティで監視を育てる 〜Mackerel Meetup #15 Tokyoを開催しました! 話題は、アラートが来たときのアプローチ、SREを立ち上げるにあたって会社の理解を得るヒント、障害対応のノウハウや経験、エラーバジェットが余っている状況への向き合い方、バッチシステムへのSLI/SLO適

                                                                アラート対応やSLI/SLO、エラーバジェットの運用を学ぼう (2024/01/30 19:00〜)
                                                              • Amazon CloudWatch と Datadog で実現する IVRy の SLI/SLO 運用とパフォーマンス調査

                                                                システムの可用性やパフォーマンスを確保するために、SLIとSLO の設定は非常に重要です。これらの指標を適切に運用することにより、サービス品質を維持し、ユーザー体験を向上させることができます。 IVRy のような音声通話を中心としたサービスでは、SLI/SLO の運用が特に重要です。なぜなら、IVRy はユーザーとのリアルタイムでのやり取りを提供しており、その品質が直接的にビジネスや顧客満足度に影響を与えるからです。例えば、通話の接続成功率はサービスの評価に直結します。このため、SLI/SLO の運用を通じて、サービスの可用性やパフォーマンスを維持することは、IVRy の運用における重要な要素です。 SLI はサービスの健全性を測るための指標であり、SLO はその指標に基づいて達成すべき目標値を設定するものです。IVRy においては、例えば「通話成功率」や「通話品質」「API のレスポンス

                                                                  Amazon CloudWatch と Datadog で実現する IVRy の SLI/SLO 運用とパフォーマンス調査
                                                                • ALBログからパスベースのメトリクスを生成する:SLOを手軽に始めるためのSLI計測 - Topotal Blog

                                                                  こんにちは、SREの與島(よしま)です。 Topotalでは、SRE as a ServiceというSREを軸にした技術支援サービスを提供しており、これまで何度かSLOの導入支援を行ってきました。 AWSで稼働しているサービスでSLOを導入するときには、ALBメトリクスでSLIを計測するというのがよくあるパターンです。低コストでSLIを計測できる一方で、SLIがユーザー体験と結びつかずサービスの改善につながらないケースがありました。これは、ALBメトリクスがパス単位で区別できず、重要なパスとそうでないパスが同じ指標に混ざるためです。 この課題に対して、ALBログをもとにPath/Host/Method単位でCloudWatchカスタムメトリクスを投稿するLambda関数を開発し、SLI計測の実装コストと有用性の両立を試みました。 この記事では、この取り組みの背景とアプローチを紹介します。な

                                                                    ALBログからパスベースのメトリクスを生成する:SLOを手軽に始めるためのSLI計測 - Topotal Blog
                                                                  • SLO、SLI、SLAとは何か?

                                                                    この記事はWhat are SLOs, SLIs, and SLAs?の意訳です。 サービスレベルとは、特定期間中にユーザーに提供されたサービスの状態を、測定可能な表現方法で言い表したものです。 サービスレベル目標(SLO)とは、システムから期待される可用性などに関する目標値ですサービスレベル指標(SLI)とは、システムの可用性などを特定するための主要な測定値ですサービスレベル契約(SLA)とは、合意された内容およびシステムがSLOを満たさなかった場合の対応を説明した法的契約です。たとえば、動画配信サイトに関するSLOでは、1週間の99%において、動画の再生を2秒以内に開始しなければならないと取り決められている場合があります。SLIは、サイト上で再生ボタンが押されてから2秒以内に開始した動画の割合を測定します。SLAには、このSLO、顧客、サービス提供者が合意した他のSLO、対象となるサー

                                                                      SLO、SLI、SLAとは何か?
                                                                    • 「我々はこうしてSLI/SLOを設計して運用を始めました -これからSLI/SLOの運用を始める人に向けて-」というタイトルで登壇してきました - inSmartBank

                                                                      こんにちは。株式会社スマートバンクでSREをしている@maaaatoです。 5月19日にFindyさん主催の「SRE大集合!みんなで学ぶ、信頼性を高めるための取り組みLT大会」が開催されました。 このイベントに「我々はこうしてSLI/SLOを設計して運用を始めました -これからSLI/SLOの運用を始める人に向けて-」というタイトルで登壇してきました。 このブログでは当時お話出来なかった+αの話とイベントの感想を書きたいと思います。 speakerdeck.com 登壇内容 前半ではCUJ/SLI/SLO/エラーバジェットについて改めて確認し、株式会社スマートバンクにおけるSLI/SLOの運用の現状について説明しています。 後半ではSLI/SLOの設計・運用のアプローチをどのように進めたのか、最後にまとめと今後の展望について説明しています。 主にSLI/SLOをこれからやっていこうと思って

                                                                        「我々はこうしてSLI/SLOを設計して運用を始めました -これからSLI/SLOの運用を始める人に向けて-」というタイトルで登壇してきました - inSmartBank
                                                                      • 信頼性向上のためのSLI/SLO導入vol.1 - 紹介と必要性

                                                                        This post is also available in the following languages. English, Korean, Chinese はじめに こんにちは。SRE(site reliability engineering、サイト信頼性エンジニアリング)業務を担当しているEnablement EngineeringチームのDahee Eo、Service ReliabilityチームのKi Cheol Cheonです。 私たちの2つのチームはService Engineering室に所属しており、LINEアプリが提供するサービスの品質向上と可用性の確保を目指して技術活動を行っています。具体的には、メッセージングサービスやメディアプラットフォームなど、LINEアプリサービスのSREを担当しています。この目的を達成するために、サービスリリースやイベントに必要な技術要素

                                                                          信頼性向上のためのSLI/SLO導入vol.1 - 紹介と必要性
                                                                        • GCP の Cloud Monitoring を使って SLI/SLO を運用する

                                                                          概要 こんにちは、@sshota0809 です。 本記事は Uzabase Advent Calendar 2021 の 7 日目の記事となります。 昨今、SRE の文化を取り入れたり組織を新たに作ったりと様々なチャレンジをする会社が増えていると思います。 また、その中で SLA/SLI/SLO といったサービスに対する指標の策定、運用にチャレンジをする方たちも多いと思います。 今回は、SLI/SLO を定義及び運用するプラクティスの 1 つとして GCP の Cloud Monitoring を使った方法を紹介します。 TL;DR GCP の Cloud Monitoring には SLI/SLO を定義できる機能がある ドキュメント 定義した指標に対してエラーバジェットのバーンレートベースのアラートも定義することができる 各種設定は Terraform のモジュール を使うと簡単 GC

                                                                            GCP の Cloud Monitoring を使って SLI/SLO を運用する
                                                                          • 今 SLI/SLO の監視をするなら Sloth が良さそうという話

                                                                            3-shake SRE Tech Talk #4 (https://3-shake.connpass.com/event/253028/) の登壇資料です。LT です。

                                                                              今 SLI/SLO の監視をするなら Sloth が良さそうという話
                                                                            • 『SLOサービスレベル目標』- SLI/SLO/エラーバジェットを私たちは設定できるのか?と考えた - Magnolia Tech

                                                                              SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド 作者:Alex HidalgoオライリージャパンAmazon 発売されてすぐに買ったものの、なかなか手をつけていなかった『SLOサービスレベル目標』をようやく読んだ。 以下、読書メモ 繰り返し出てくるのは、「完璧を目指さないこと」…目指すのはある程度の完璧さであり、限られたリソースの中、個々の要素に囚われすぎず、全体最適を目指すこと サービスの信頼性は、「ユーザー目線」であるべきで、サービスを提供する側の目線では無い SLI、サービスレベル指標は、ユーザーにとって価値が得られたか否かの閾値、基準を示すもの……例えば、ユーザーへの画面表示は2秒以内に行われるべきである、といった定義がされる SLO、サービスレベル目標は、サービスレベル指標がどの程度の割合となるべきか、その目標を示すもの……例えば、ユーザーへの画面

                                                                                『SLOサービスレベル目標』- SLI/SLO/エラーバジェットを私たちは設定できるのか?と考えた - Magnolia Tech
                                                                              • 再考: みてねにおけるSLI/SLO

                                                                                2024/10/30 - SRE NEXT 2024をふりかえって 〜学びをもとにした取り組み事例紹介〜 の資料です。 p.5 右下のスライド: https://speakerdeck.com/honmarkhunt/nao-masikislo p.6 大きな組織にSLOを導入し 運用すると…

                                                                                  再考: みてねにおけるSLI/SLO
                                                                                • SLI Battery Aftermarket Size, Growth, Trends Report 2034

                                                                                  ✉ info@marketresearchfuture.com 📞 +1 (855) 661-4441(US) 📞 +44 1720 412 167(UK) 📞 +91 2269738890(APAC) Global Market Outlook In-depth analysis of global and regional trends Analyze and identify the major players in the market, their market share, key developments, etc. To understand the capability of the major players based on products offered, financials, and strategies. Identify disrupting pro

                                                                                  新着記事