aiops智能监控的成功实践

aiops智能监控的成功实践

ID:20882515

大小:2.02 MB

页数:24页

时间:2018-10-17

aiops智能监控的成功实践_第1页
aiops智能监控的成功实践_第2页
aiops智能监控的成功实践_第3页
aiops智能监控的成功实践_第4页
aiops智能监控的成功实践_第5页
资源描述:

《aiops智能监控的成功实践》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、AIOPS智能监控的成功实践从Devop到AIOps阿里巴巴集团的智能监控场景实战123阿里巴巴AIOps智能监控产品体手动运维人工决策人工执行人工判断自动执行自动判断自动执行自动化运维(DEVOPS)智能化运维(AIOPS)从DEVOPS到AIOPS是运维技术发展的必然趋势AIOPS是运维技术的未来发展趋势10%2017年AIOps部署率50%2020年AIOps部署率AIOps能为我们带来什么?AIOPS科技树AIOPS质量监控时序异常检测指标相关性分析报警收敛根因分析故障类型判定历史故障推荐可疑应用/事件推荐故障自愈自动化触发快恢脚本执

2、行环境成本容量容量预测自动熔断调度资源调度流量调度效率无人值守发布值班运维机器人信息流转任务执行如何孵化AIOps能力?运维场景智能监控智能调度智能问答异常检测最优化策略/规划&预测NLP/意图识别监控/时间序列数据CMDB运维故障场景语料AIOPS技术架构:场景、算法、数据三位一体算法组件运维数据AIOPS团队架构:运维/研发/算法/产品/运营多位一体阿里巴巴GOC团队的智能监控场景实战阿里巴巴集团全球运行指挥中心AIOPS技术倡导者和领先实践者故障发现故障定级故障通告故障辅助定位处理决策故障快速恢复故障复盘故障演练业务流程业务指标监控故障

3、定级/决策调度故障相关信息流转智能基线规则引擎/根因分析ChatBot海量业务指标/系统指标数据故障CMDB/运维数据仓库故障信息的结构化/非结构化记录AIOps@GOC团队运维场景算法组件运维数据专业智能运维算法团队监控中心运维团队工程研发团队团队支持千锤百炼的”智能基线”用户眼中的阿里集团业务GOC眼中的阿里集团业务智能基线之业务指标监控健壮长期经受各种外部攻击/爬虫内部压测干扰的历练精准准确/全面发现业务异常并触发报警高效支持秒级/分钟级计算无需任何人工监控配置普适支持各行业业务数据一键接入各类监控系统数据研发/运维眼中的系统监控数据针

4、对系统/应用级指标的轻量级异常检测算法智能基线之系统指标监控轻量可支持千万量级系统级别监控项精准准确/全面发现系统/应用指标并触发报警便捷支持直接异常输出或智能水位推荐功能不断演进的根因分析能力单指标多维下钻分析当业务指标总量异常出现时,准确地智能定位到出现异常的分量或分量组合多指标相关性分析当指标异常时,动态发现有相似下跌形态的相关指标,为原因定位提供重要线索通过离线分析,发现业务报警之间的关联规则,当单业务异常时能够对其它业务进行提前预警可疑应用/事件分析自动基于运维数据仓库进行相关应用/事件检索,锁定怀疑范围自动根据指标异常和事件相关性

5、进行推荐排序,筛掉无关事件AIOps智能监控产品体系AIOps智能监控产品体系监控展示异常发现报警发现根因分析信息流转故障恢复相关事件推送智能监控大盘智能基线多指标关联分析智能报警收敛智能干系人管理可疑应用分析多维下钻SREBot快速恢复切换故障信息检索故障处理生命周期

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。