运维稳定性 – 软件测试的价值
阿里十年总结之软件测试的价值 最近拜读了很多集团测试大佬总结过往工作经验写下的文字。我想,自己从事测… 继续阅读 运维稳定性 – 软件测试的价值
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
阿里十年总结之软件测试的价值 最近拜读了很多集团测试大佬总结过往工作经验写下的文字。我想,自己从事测… 继续阅读 运维稳定性 – 软件测试的价值
随着虎牙业务量的大规模增长,分布式应用服务架构日益复杂,排障定位变得越来越困难,原有传统监控方式已无… 继续阅读 运维稳定性 – 虎牙APM可观测平台建设实践
最近更新:故障经验、Kubernetes架构、持久化存储、Helm、CICD、Ingress-ngi… 继续阅读 排查 K8S 问题的经验和技巧
尚梦宸,中国信息通信研究院云计算与大数据研究所审计与治理部工程师。 一、构建新时代“大运维”体系 什… 继续阅读 运维稳定性 -故障处理的系统稳定性与可观测性能力实践(系统稳定性保障)
笔者从 12 年开始入行,从事 DevOps 研发工作,做过部署系统、监控系统、可观测性相关产品,也… 继续阅读 运维稳定性 – 故障处理的系统稳定性与可观测性能力实践
运维生产故障是指在运维过程中出现的各种问题和故障,可能导致系统停机、服务中断或其他运维效率问题。运维… 继续阅读 运维生产故障有哪些?运维常见问题最佳实践
工业革命是指从18世纪末到19世纪中叶,以及20世纪初的一系列重大技术、经济和社会变革的过程。虽然没… 继续阅读 新的工业革命即将开始?
1. IBM:IBM采用了ITIL框架来改进其IT服务管理流程,提高了服务交付效率和客户满意度。2.… 继续阅读 ITIL 服务管理框架,实践成功案例
对于故障,复盘是一件非常重要的事情,因为我们的成长基本上就是从故障中总结各种经验教训,从而可以获得最… 继续阅读 故障复盘 – 3个核心5要素有效提高故障复盘质量
德鲁克的著作影响了数代追求创新以及最佳管理实践的学者和企业家们,各类商业管理课程也都深受彼得·德鲁克… 继续阅读 德鲁克管理7大原则,每一条都是精华