IT服务治理 – SRE工具链建设思路与实践
对传统业务运维的能力也提出了更高的要求,除了具备基础运维能力外,还需拓展包括对业务的理解、工具研发、数据分析、甚至是AIOps等能力,这也是我们所理解的SRE。
IT 数字化服务运营管理 之 运营的人工智能 (AIOps): 监控、管理、控制
对传统业务运维的能力也提出了更高的要求,除了具备基础运维能力外,还需拓展包括对业务的理解、工具研发、数据分析、甚至是AIOps等能力,这也是我们所理解的SRE。
讲师简介 张戎 机器学习研究员 社交网络运营部 我是一个做机器学习的人,目前接触运维的时间并不长,大… 继续阅读 IT服务治理 – 腾讯运维的 AI 实践思路指引
1 从一个 NLP 故事说起 首先我想从一个 NLP 小的故事来说起。 在二十世纪三四十年… 继续阅读 IT服务治理 – AIOps 在腾讯的探索和实践
01 腾讯PCG的前世今生 1. 问题和挑战 腾讯PCG事业群由于是由多个其他事业群合并而来,之前的… 继续阅读 IT服务治理 – 腾讯 PCG 数据中台 DEVOPS 和 AIOPS 实践
讲师介绍: 赵应钢,曾就职于百度、新浪、去哪儿网等,10年数据库自动化运维开发、数据库性能优化、大规… 继续阅读 IT运维治理 – 美团点评数据库智能运维探索与实践
阿里巴巴全球运行指挥中心,GOC (Global Operations … 继续阅读 故障治理 – 运行无间:阿里巴巴运维保障体系的一种最佳实践
导读:大家好,我是来自唯品会实时平台 OLAP 团队的王玉,主要负责唯品会这边 Presto、Kyl… 继续阅读 运维工具 – 唯品会王玉:老司机教你如何调教Presto和ClickHouse,应对业务难题!
本文整理自快手数据技术专家李天朔在 5 月 22 日北京站 Flink Meetup 分享的议题《快… 继续阅读 运维工具 – 快手基于 Flink 构建实时数仓场景化实践(监控实施思路)
一、演进历史和运维挑战 阿里的实时计算经历了近 10 年的快速发展,总体来说可以分成三大时代: 1.… 继续阅读 运维工具 – 阿里超大规模 Flink 集群运维实践(实时监控必备工具之一)