一、运维工作梳理
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
运维到底是做什么的?首先我们先来了解下运维的三大阶段。
一般说来,企业的运维发展由起步到成熟,大致要经过三个大阶段:运维无序化、运维标准化和流程化、运维自动化。
运维无序化主要表现在运维工作无规范统一,更多是团队成员依赖自身技术各自为战,着重于眼前运维工作,过多处于被迫接受和疲惫应付工作的状态。运维无序阶段提升工作效率主要依赖加人和加班,而且此阶段运维工作效率低下,人为失误较多,故障排除难度较大。长时间的运维无序化,对内团队成员极度疲惫和不自信,对外主要表现为不再被各业务部门和其他IT兄弟团队所信任。一般创业初期的IT运维处于无序化较多,如何解决结束无序化的苦恼,解放生产力呢?答案更多被提及的是运维自动化。然而面对众说纷纭的运维自动化平台,如何结合自身条件进行落地实现呢?答案很多,有购买商业产品(价格真的不便宜),有自主研发,结合本人推行运维自动化的实际经验提醒各位,不管哪种方式,运维标准化和流程化一定是首先要做的,否则运维自动化只能是空中楼阁,欲求不得。
什么是运维标准化和流程化呢?如果非要给出定义的话,那么我的定义是两个字:文档。
运维的标准化和流程化首先要以文档的形式进行展示,并且能够指导日常运维工作。国有国法,家有家规,冰箱洗衣机都有说明书,运维标准化流程化就是运维工作的国法家规,运维工作如何进行的说明书。相比开发、测试等其他岗位,运维工作直面生产环境,每一步运维操作与生产系统能否正常运行息息相关,稍有不慎就易产生生产事故。并且运维自动化的落地实施也是要基于运维的标准化和流程化,所以作为运维管理的第一步,不可忽略。
标准化和流程化的建设思路一般是包括三大部分:日常工作梳理、标准化和流程化制定、日常工作标准化和流程化执行。
一、运维工作梳理
● 数据中心运维主要因为有自建IDC机房和部分托管在其他IDC机房的服务器,所以日常运维工作中有关于数据中心相关的工作,例如数据中心的设计和建设工作,数据中心日常巡检,数据中心权限管理、备件梳理管理、设备上下架等管理。如果是部署在云端的企业,对于数据中心的运维工作会少一些。
● IT资源运维主要是指计算、存储、网络和安全四大基础资源的运维工作。计算资源包括物理服务器的管理,如开关机、配置修改、资源增加等;存储资源管理一般包括自建分部署存储、商业存储、NAS等相关存储资源的账户权限管理、容量管理、监控等;网络资源运维管理工作主要包括网络权限管理、设备配置变更等等;安全资源运维管理主要日常与安全相关的规章制度和策略以及安全设备具体操作等。IT资源运维工作涉及日常运维工作基础资源,是整个运维工作的重点,基础资源的保障好坏,关系着上层应用服务的健康运行情况。
● 系统运维的日常大多是与服务运维相关。运维服务部署(如:Nginx部署、JDK、Tomcat的部署等)、服务的配置变更和服务发布、服务变更等。服务运维设计的标准和规范指导日常服务运维工作的进行,并且为自动化运维做铺垫,这要求在日常运维工作中,对于重复的手工运维工作尽量通过脚本或是其他变成语言实现自动化。
● 事件管理针对日常运维工作中出现的运维事件进行处理指导和提出管理方案。主要包括对事件进行分类、事件处理流程、如何汇报事件以及事件的总结等。
通过对日常运维工作所涉及的内容进行分类整理,并且加工提炼最后形成运维的标准和规范,将一些流程化的工作进行固化,并且逐步实现运维自动化,提高运维效率。