IT服务治理 – AIOps 在腾讯的探索和实践
1 从一个 NLP 故事说起 首先我想从一个 NLP 小的故事来说起。 在二十世纪三四十年… 继续阅读 IT服务治理 – AIOps 在腾讯的探索和实践
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
1 从一个 NLP 故事说起 首先我想从一个 NLP 小的故事来说起。 在二十世纪三四十年… 继续阅读 IT服务治理 – AIOps 在腾讯的探索和实践
01 腾讯PCG的前世今生 1. 问题和挑战 腾讯PCG事业群由于是由多个其他事业群合并而来,之前的… 继续阅读 IT服务治理 – 腾讯 PCG 数据中台 DEVOPS 和 AIOPS 实践
讲师介绍: 赵应钢,曾就职于百度、新浪、去哪儿网等,10年数据库自动化运维开发、数据库性能优化、大规… 继续阅读 IT运维治理 – 美团点评数据库智能运维探索与实践
阿里巴巴全球运行指挥中心,GOC (Global Operations … 继续阅读 故障治理 – 运行无间:阿里巴巴运维保障体系的一种最佳实践
导读:大家好,我是来自唯品会实时平台 OLAP 团队的王玉,主要负责唯品会这边 Presto、Kyl… 继续阅读 运维工具 – 唯品会王玉:老司机教你如何调教Presto和ClickHouse,应对业务难题!
本文整理自快手数据技术专家李天朔在 5 月 22 日北京站 Flink Meetup 分享的议题《快… 继续阅读 运维工具 – 快手基于 Flink 构建实时数仓场景化实践(监控实施思路)
一、演进历史和运维挑战 阿里的实时计算经历了近 10 年的快速发展,总体来说可以分成三大时代: 1.… 继续阅读 运维工具 – 阿里超大规模 Flink 集群运维实践(实时监控必备工具之一)
在讲解事件、故障处理思路前,先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统… 继续阅读 IT服务管理:故障治理 – 运维故障排查处理思路
大规模Zabbix万台应用监控场景下,针对告警、可靠性工程实践经验;通过Zabbix二次开发,集成运维平台、工单、值班、自愈系统,通告警服务化、数据化,为业务保驾护航,保障稳定性工程落地。
如何理解ITIL相关重要流程: ITIL 重点与难点案例: