【课程特色】
1. 课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。
2. 清晰的知识结构,根据应用经验采用最优化授课模式。
3. 内容充沛、详略得当,前后呼应。
4. 讲师资历丰富,具有丰富的实践经验。
5. 知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪
【课程时间】3天
【课程大纲】
第1章 运维是做什么
1.1 IT运维的4件要事
1.2 IT运维服务的原则
1.3 实现服务平衡
1.4 落实整体运维
1.5 贯穿始终的服务流程
第2章 有目的、有计划地做事
2.1 怎样确定目标
2.2 怎样制订计划
2.3 怎样按计划做事
第 3章 运维硬功夫——运维硬件技术介绍
3.1 服务器
3.2 存储设备
3.3 网络设备
3.4 硬件运维技能攻略
第4章 运维软功夫——运维软件技术介绍
4.1 操作系统
4.2 中间件软件
4.3 数据库
4.4 数据备份软件
4.5 安全软件
4.6 双机软件
第 5章 精准运维服务
5.1 发现运维的价值
5.2 精准运维的由来
5.3 精准运维的定义
5.4 精准运维的方法
5.5 互联网、大数据与精准运维
5.6 精准运维的利器:风控模型
第6章 运维服务的治理
6.1 理想与困惑
6.2 运维服务治理的目的
6.3 运维服务治理的原理
6.4 运维治理实例
第7章 应用运维
7.1 初识应用运维
7.2应用运维,保障企业应用稳定运行的关键
7.3演进过程
第8章 智能运维
8.1初识智能运维
8.2智能运维,赋予企业运维更强悍的大脑
8.3演进过程
第9章 智能、互联时代的应用运维
9.1应用演进趋势
9.2技术演进趋势
9.3 应用智能运维系统:企业数字战略的关键支撑
9.4商业价值评估(ROI分析)
9.5系统关键能力
第10章 应用运维智能化的关键技术
10.1异常检测:筛选时间序列数据,发现潜在风险
10.2关联分析:实现全景化应用监控的基础
10.3数据统计:敏捷高效的信息提取手段
10.4预测分析:使应用性能风险防患未然
10.5因果推理:专家经验辅助决策支持
10.6自治控制:应用运维过程的自动化管理
第11章 应用智能运维工具图谱
11.1开源工具
11.1.1业务流程巡检拨测
11.1.2应用请求链路追踪
11.1.3存储海量监控数据
11.1.4机器数据检索分析
11.1.5人工智能算法支撑平台
11.1.6 应用监控数据可视化
11.1.7告警及风险智能管理
11.2商业化产品
11.2.1 Dynatrace:软件智能平台
11.2.2 AppDynamics:思科的战略新方向
11.2.3 NewRelic:让应用运维随需即取
11.2.4 RealSight APM:全景化应用智能管理
11.2.5 Datadog:深度分析应用性能
11.2.6 BigPanda:AIOps算法驱动应用自动化运维
11.2.7 Numenta NuPIC:类脑计算践行异常检测
第12章 立足实际需求,规划系统落地方案
12.1前期准备
12.1.1 需求准备:理解企业现有的应用运维过程
12.1.2 应用准备:为目标应用的运行状态准确画像
12.1.3 人员准备:组建技术和管理专家团队
12.1.4技术准备:储备运维智能化的关键技术
12.2规划设计
12.2.1围绕运维现状,规划建设愿景
12.2.2多部门协作,规划服务质量目标
12.2.3制订监控策略,设计SLO计算算法
12.2.4专注过程,规划有效的风险管理机制
12.3 概念验证
12.3.1 围绕核心业务,验证用户数字体验监控方案
12.3.2 验证应用全栈监控数据采集技术
12.3.3 验证业务流程监控的可行性
12.3.4 验证趋势预测算法的可行性
12.3.5 验证根源问题分析算法的可行性
第13章 从零开始搭建应用智能运维系统
13.1目标应用场景的定义
13.2 规划设计
13.3应用全栈监控数据采集
13.3.1 用户侧用户数字体验数据采集
13.3.2 应用可用性数据采集
13.3.3 业务流程数据采集
13.3.4 应用运行环境状态数据采集
13.4搭建数据湖,存储运维大数据
13.4.1 时间序列指标数据存储
13.4.2 应用代码链路数据存储
13.4.3 链路、拓扑图等关系数据存储
13.4.4 数据湖存储与检索能力融合
13.5实现全景视图的监控数据可视化
13.5.1 业务优先的应用全景可视化仪表盘
13.5.2 定义级联可视化人机交互界面
13.5.3 选择监控指标,定义告警策略
13.6算法驱动,实现应用风险态势感知
13.6.1 时间序列监控指标的趋势预测
13.6.2建立实时智能的异常检测能力
13.6.3通过因果推理分析定位风险根源
13.7应用风险告警的智能化管理
13.7.1搭建智能化的告警管理框架
13.7.2 遍在数据接入,随时回溯数据、解释告警
13.7.3 智能合并告警,有效管理风险
13.7.4 应用风险根源分析的智能化
13.7.5手机端主动探伤检测,防患未然
第14章 典型应用场景实践
14.1开发运维一体化场景
14.2应用运行环境的稳定性性能保障
14.3基于微服务架构的应用性能监控
14.4基于大数据架构的应用运维智能化
14.5遍在接入的云应用运维智能化
14.6互联网应用的用户数字体验保障
14.7物联网应用运维场景
14.8应用运行环境的异常检测
14.9应用网络质量的预测与分析
第15章 行业案例实践
15.1网联汽车
15.1.1 建设背景
15.1.2 解决方案
15.1.3建设效果
15.2制造业
15.2.1建设背景
15.2.2解决方案
15.2.3建设效果