运维人员在落地数据思维中的第一步是形成初步的运维数据的生态,具备数据的输出场景能力。
一、具备运维数据生态
通俗点说,运维数据生态是集中了公司展业的所有数据,并让适配场景的数据进行流动。对于资源管理来说,基于CMDB的数据大致有以下两类,数据中心数据,包括了机房、机柜、U位、设备、服务器和配件、系统版本、IP信息。云管数据,包括了宿主机、虚拟机、容器、系统版本、IP信息、承载系统、负载均衡、系统信息、中间件信息、业务信息。基于系统的数据均来自有业务日志,包括时间、请求号、系统、接口、方法、耗时、响应码。基于业务的信息大致有pv、uv、转化率、成功率、新客人数、利润等。基于组织架构的信息大致有部门、团队、人员等。另外还有一些文档数据,如需求文档,接口文档,知识库。如下图所列,具备运维数据的生态基础需要将上述源数据进行采集、存储、加工、分析,最终达到应用的效果。
二、提供数据使用场景
运维的日常场景很多,看似复杂,终究离不开对稳定、安全、高效、低成本四项基本价值的更高追求。通过运维数据化能力,运维能为企业决策提供有力支撑,实现稳定、安全、效率的提升,和对成本的合理把控。在本文中我们只对常见的场景进行简单的描述,详细的场景分析将在下一篇中体现。知识图谱,使用统一的语言来定义运维数据,将运维对象通过实体与实体间的关系来表达,整合运维领域内的实体关系形成知识图谱。运维领域的关系包括但不限于产品、服务、集群、服务器、网络、IDC等。数据中台,建立面向运维域的数据中台,统一纳管如资源数据、告警数据、性能数据、业务数据、日志数据、工单数据、指标数据、拨测数据等,面向上层运维分析场景提供统一的数据访问路由、数据服务目录、数据接入管理、 数据可视化等功能,以期打破“数据孤岛”,通过整合关联和对外开放来深度 挖掘运营数据的价值。识别前台数据需求,整合后台数据,对数据进行加工和输出,建立数据中心级的数据服务共享平台。通过对数据的梳理,数据源的规划,数据流程的整合,对存量数据进行加工整合,达到以数据服务化的方式来 实现数据监控,资源使用率分析。数据可视化,通过对数据的可视化呈现,帮助运维人员直观、便捷、快速的进行问题分析,还可提供一系列的工具组件让运维人员根据自己的业务情况对海量数据进行快速进行视图编辑、多层下钻分析、多维度关联分析、报表编排,横向纵向大盘数据对比等,将传统的运维经验进行数字化转变,大大提升了问题排查、风险发现和知识沉淀。下一篇文章中,将进行更高阶的场景描述,如无人值守变更、故障自动评估、故障自动预测。
三、养成每天看数据的习惯
运维人员应具备看数据的好习惯,以笔者为例,每天最重要的的事是随时看监控数据,同时兼顾业务数据,同时保持对数据的敏感性。对于数据的表现,不管正常还是异常,都需要跟研发团队、产品团队、业务团队保持沟通,让大家知晓目前的项目和线上产品的数据表现。这样做一方面能获得来自团队的反馈,有反馈会进一步强化我们看数据的行为。另一方面也建立自己靠谱的形象,能做到每天看数据、看业务指标,这就是运维人员的靠谱。