稳定性保障 – 故障应急体系构建及应用实践(1)
蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
蚂蚁集团SRE技术专家刘凯宁在演讲中介绍了蚂蚁故障应急全流程体系,包括故障体系、应急体系、故障全生命… 继续阅读 稳定性保障 – 故障应急体系构建及应用实践(1)
2024年12月11日,OpenAI经历了一场全球范围的服务中断,持续时间超过四个小时,影响了Cha… 继续阅读 故障复盘 – 2024.12.11 OpenAI全球服务宕机复盘:技术架构的脆弱性与教训
一天,玛丽的儿子劳伦在摆弄 MIT 。当她在键盘上乱按的时候,一条错误信息突然出现。劳伦不知怎地启动… 继续阅读 第一个运维工程师
其实现在的计算机系统是一个极其复杂,而且依赖很多的分布式系统,出现事故是在所难免的,关键是如何对待事… 继续阅读 故障复盘 – 遇到P0级别故障如何做故障复盘?
引言 Python 是一种广泛使用的高级编程语言,其强大的功能和活跃的社区支持使得它成为许多开发者的… 继续阅读 PYTHON基础技能 – Python环境搭建与管理的9个常见问题解答
引言 本文旨在系统地介绍构建机器学习模型的基本步骤,并通过一个具体的实战案例——股票价格预测,展示这… 继续阅读 PYTHON基础技能 – 构建Python机器学习模型的8个步骤
今天我们将一起探索Python中最强大且高效的两个数据结构——字典和集合,它们在数据处理中扮演着至关… 继续阅读 PYTHON基础技能 – Python字典与集合的15个高级操作与优化建议
1 软件系统风险与变更 变更是软件系统进化的推动力,同时也是孕育风险的温床。如果一个系统没有了相应的… 继续阅读 稳定性治理 – 代码变更风险可视化稳定性治理
1 创建虚拟环境conda create -n env_nameconda create -n en… 继续阅读 conda常用命令
在日常工作中,重复性的任务不仅耗时,还容易出错。Python凭借其简洁易学的语法,成为许多办公室自动… 继续阅读 PYTHON基础技能 – Python自动化办公的14个实用脚本