跳转到内容

IT 运营管理:ITIL 最佳实践

IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制

viplao

479站点RSS订阅

viplao 的帖子

系统稳定性保障 – 货拉拉微服务架构故障演练实践

一、背景 随着货拉拉微服务架构、容器化技术广泛使用,软件架构的复杂度在不断提升,由服务之间的依赖所带… 继续阅读 系统稳定性保障 – 货拉拉微服务架构故障演练实践

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 故障演练, 稳定性建设

系统稳定性保障 – 大厂故障演练思考

引言阿里巴巴经过多年的技术演进,系统工具和架构已经高度垂直化,服务器规模也达到了比较大的体量。当服务… 继续阅读 系统稳定性保障 – 大厂故障演练思考

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 故障演练, 稳定性建设

系统稳定性保障 – 微服务架构下如何做好故障演练

微服务架构场景中,应用系统复杂切分散。长期运行时,局部出现故障时不可避免的。如果发生故障时不能进行有… 继续阅读 系统稳定性保障 – 微服务架构下如何做好故障演练

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性保障 – 云原生大潮下的混沌工程思考

简介:生产环境的突袭演练是我们迈出的艰难但有力的一步,锻炼了研发运维人员的应急响应能力,在真实用户场… 继续阅读 系统稳定性保障 – 云原生大潮下的混沌工程思考

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性保障 – 哪儿网故障演练实践经验

大家好,我是来自去哪儿网的刘志志,19年加入去哪儿网,主要参与CI/CD平台建设,负责故障演练平台的… 继续阅读 系统稳定性保障 – 哪儿网故障演练实践经验

  • 发表于: 2024年10月13日 2024年10月13日
  • 作者: viplao
  • 标签: 稳定性建设

系统稳定性保障 – 美团AIOps在事件管理的硬核实践 

文中所提及的事件并不仅限于故障,还包括运维工作中的告警、异常等。 “An inciden… 继续阅读 系统稳定性保障 – 美团AIOps在事件管理的硬核实践 

  • 发表于: 2024年9月22日 2024年9月22日
  • 作者: viplao
  • 标签: 故障治理

可观测性(Observability) – 监控和可观测性区别

监控 定义 监控(monitor)只是通过收集系统中预定义的指标集或日志集,告知并表明出了什么问题。… 继续阅读 可观测性(Observability) – 监控和可观测性区别

  • 发表于: 2024年9月21日 2024年9月21日
  • 作者: viplao
  • 标签: 可观测性

可观测性(Observability)- 聚合度量

度量(Metrics)的目的是揭示系统的总体运行状态。相信大家应该见过这样的场景:舰船的驾驶舱或者卫… 继续阅读 可观测性(Observability)- 聚合度量

  • 发表于: 2024年9月21日 2024年9月21日
  • 作者: viplao
  • 标签: 可观测性

可观测性(Observability) – 链路追踪

虽然 2010 年之前就已经有了 X-Trace、Magpie 等跨服务的追踪系统了,但现代分布式链… 继续阅读 可观测性(Observability) – 链路追踪

  • 发表于: 2024年9月21日 2024年9月21日
  • 作者: viplao
  • 标签: 可观测性

可观测性(Observability)- 事件日志

日志用来记录系统运行期间发生过的离散事件。相信没有哪一个生产系统能够缺少日志功能,然而也很少人会把日… 继续阅读 可观测性(Observability)- 事件日志

  • 发表于: 2024年9月21日 2024年9月21日
  • 作者: viplao
  • 标签: 可观测性

分页

上一页 页码: 1 … 页码: 16 页码: 17 页码: 18 页码: 19 页码: 20 页码: 21 页码: 22 页码: 23 页码: 24 页码: 25 页码: 26 … 页码: 48 下一页

近期文章

  • AI工具-把 Claude Skills 官方教程讲清楚
  • RAG架构演进梳理
  • 什么是系统稳定性?怎么才称得稳?
  • 沙箱验证原理与经验分享
  • 电商架构图详细分类

AI提示词 excel分析 flink sql 基础实践 ITIL最佳实践 Prompt攻略 代码BUG 企业文化 危机管理, 变更执行 可观测性 告警治理 复盘 安全问题 宕机 实践案例 容量不足 思维认知 故障复盘 故障治理 故障演练 数据分析挖掘实践 数据质量治理 流程规范 混沌工程 电商运营数据分析实践 稳定性保障 稳定性建设 稳定性治理实践 经验教训 舆情事件

© 2026                 IT 运营管理:ITIL 最佳实践.               粤ICP备2022017430号
本文部分内容摘录于互联网,只做参考学习,若有版权问题请联系处理               viplao@qq.com