跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

稳定性建设标签存档订阅

SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践(2)

一、前言 之前在《云原生背景下的运维价值思考与实践(上)》 里,重点介绍了云原生背景下运维转型的思考… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践(2)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践

讲师介绍 刘天斯,腾讯游戏营销SRE负责人,腾讯T12级技术专家,国家工程实验室兹聘专家(工业大数据… 继续阅读 SRE工具链建设实践:一夜颠覆60%旧体系,腾讯的SRE运维转型实践

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?

一、认识数据资产 二、数据治理-方法论 三、CMDB平台建设 四、B站SRE资产平台建设之路 一、认… 继续阅读 CMDB是配置管理库它应该长得怎么样?数据资产体系如何建设?

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

混沌工程与SRE的结合(中国移动)

中国移动信息技术中心技术专家,中国移动磐基CMChaos平台负责人晁元宁分享了《混沌工程与SRE的结… 继续阅读 混沌工程与SRE的结合(中国移动)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

稳定性保障 – 故障应急体系构建及应用实践(2)

本文主要介绍了蚂蚁集团大规模互联网系统中业务SRE的稳定性实践,包括业务SRE的定义、应急管理、大促… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(2)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

稳定性保障 – 故障应急体系构建及应用实践(1)

蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)

  • 发表于: 2024年12月29日 2024年12月29日
  • 作者: viplao
  • 标签: 稳定性建设

稳定性建设 -美团代码变更风险可视化系统建设与实践

变更是软件系统进化的推动力,同时也是孕育风险的温床。如果一个系统没有了相应的迭代和变更,那这个系统就… 继续阅读 稳定性建设 -美团代码变更风险可视化系统建设与实践

  • 发表于: 2024年12月8日 2024年12月8日
  • 作者: viplao
  • 标签: 稳定性建设

盒马新零售运维保障解决方案

今天我带来的是“新零售运维保障解决方案”,内容包括三方面,新零售的现状以及它的挑战、运维保障体系以及… 继续阅读 盒马新零售运维保障解决方案

  • 发表于: 2024年11月22日 2024年11月22日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性保障 – 相关能力成熟度模型介绍

保障系统稳定性是现代软件开发中最具挑战性的问题之一,也是确保业务连续运行的重要因素。云服务、大型互联… 继续阅读 系统稳定性保障 – 相关能力成熟度模型介绍

  • 发表于: 2024年10月26日 2024年10月26日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性保障 – 迄今见过最易懂的混沌工程落地实践

一、背景 从 2010 年 Netflix 上线 Chaos Mokey 的第一个版本到现在,虽然混… 继续阅读 系统稳定性保障 – 迄今见过最易懂的混沌工程落地实践

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 稳定性建设

分页

上一页 页码: 1 页码: 2 页码: 3 页码: 4 下一页

近期文章

  • 系统稳定性建设(16) – 稳定架构设计思路
  • 系统稳定性建设(15) – 各大互联网公司稳定性治理之线上故障处理
  • 系统稳定性建设(14) – 稳定性治理思路与实践
  • 系统稳定性建设(13) – AI赋能稳定性思路
  • 系统稳定性建设(12) – 线上监控指标全解(线上问题排查指南)

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 Python运营分析技能 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全认知 宕机 实践案例 容量不足 思维认知 操作失误 故障复盘 故障治理 故障演练 数据分析 流程规范 混沌工程 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2025                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com