经验教训 – 2018.06.27 阿里云回应访问故障:运维操作失误导致 将敬畏每一行代码
阿里云再次对6月27日下午发生的技术问题进行了回应和解释,称“运维上的一个操作失误,导致一些客户… 继续阅读 经验教训 – 2018.06.27 阿里云回应访问故障:运维操作失误导致 将敬畏每一行代码
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
阿里云再次对6月27日下午发生的技术问题进行了回应和解释,称“运维上的一个操作失误,导致一些客户… 继续阅读 经验教训 – 2018.06.27 阿里云回应访问故障:运维操作失误导致 将敬畏每一行代码
今天主要讲三块: 第一,阿里 Flink 发展的历史背景,怎么来的,现状规模到底什么样第二,阿里 F… 继续阅读 [运维工具]每秒几十亿实时处理,阿里巴巴超大规模 Flink 集群运维揭秘
故障是运维人员永远的痛。相信每一个运维人员的KPI中都有一项:可用性。可用性高就是不出故障,各个公司… 继续阅读 [经验分享]远离故障的十大原则
简单的读取excel 数据 将多个工作表合并为一个工作表 将一个工作表拆分为多个工作簿 XML 读取
sql是所有数据库查询的语言,sql由于本身结构化的特点,非常容易入手。针对不同的数据库,如hive… 继续阅读 【经典手册】常用SQL查询
故障发生时在故障发生时,最重要的是快速恢复故障。 而快速恢复故障的前提是快速定位故障源。因为在很多分… 继续阅读 故障发生最重要的是快速恢复故障
hadoop 2.0 对于Hadoop高可用架构节点介绍 NN服务器会出现脑裂(brain-spli… 继续阅读 运维工具 – Hadoop高可用的架构知识
https://sourceforge.net/projects/itop/files/itop/3… 继续阅读 运维工具 – i基于Centos7+Apache2.4+Mysql5.7+PHP7.3环境安装itop3
一、Flink运行时各个组件介绍 Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应… 继续阅读 运维工具 – Flink 运行架构学习
在 ITSM 领域,ITIL一直是事实上的标准。 从80年代中期 ITIL的诞生,到 v2、v3,以… 继续阅读 ITIL 实践经验 – 流程建设都是遵循由轻到重,不断结合业务需求与技术痛点持续运营优化