大运维之旅(二):大运维服务解析

更新时间:2023-10-24 06:48:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

大运维之旅(二):大运维服务解析

大运维服务涵盖了数据中心发展阶段所需要的搭建服务、支持服务、管理服务和咨询服务。

搭建服务

业务系统上线前,企业需要采购服务器、网络、存储等硬件和系统、数据库、中间件等基础软件,然后将这些软硬件搭建配置好,交付给开发或推广团队用于部署业务系统软件。因为这些产品往往不可能来源于同一个厂商,那么,这些不同厂商的产品集成在一个环境中应该怎么设计、怎么部署、怎么配置、以及出现问题怎么解决,就需要一个中间服务商承担这些工作,这就是我们所说的集成商和集成服务。

搭建不仅包括简单的软硬件安装,而且还包括实现各种功能架构,例如高可用架构、SAN架构、自动化备份、监控、灾备架构等。更进一步,这些架构所对应的规范制度、策略和方法的交付,是考验服务商和工程师的更高端技能,它们包括高可用维护和操作规范、灾备维护和演练规范、各种架构的配置方法、策略(备份策略、监控策略)等。这些规范和策略考虑了每种架构对其它架构的影响和其所关联的所有组件的深层次关系。

支持服务

厂商供货的软硬件产品一般都提供了一到三年的服务期。在这个服务期内,出现任何部件损坏、软件故障,厂商都会派工程师到场修复,免费更换备件。这就是厂商维护或维保服务。但经过一段时间的厂商维护服务,客户在涉及跨厂商产品的问题定位和解决时普遍遇到困难,这一方面是各个厂商阻止自己的工程师为客户提供其他厂商产品的服务,另一方面各厂商也没有动力去帮助客户做好兼容工作,而倾向于让客户全部选择自己的产品。因此,客户越来越倾向于当产品出厂商保后,将维护服务交给非厂商的服务商。这就是所谓的第三方维护服务的由来。

中亦作为第三方服务商,是客户问题的第一响应人。不论是否自己服务的产品,我们都可以帮助客户分析定位问题,并指导客户用合适的资源去解决这些问题。

常规的维护服务是非驻场式的,服务商提供的现场服务一般包括,每月一次的巡检、故障紧急响应和必要时的现场值守。但随着大型客户对响应时效性的要求,客户往往会要求服务商在承担维护服务时,提供人员的现场常驻,即狭义的“大运维”。因为生产环境不可能天天进行变更或出现故障,所以客户逐渐将常驻现场人员当作自己的人员来使用,让他们从事一些日常运维工作,包括文档的整理、数据的收集、监控的记录、机房的维护等,这种服务方式后来被发展成专门的驻场式运维服务。

从以上变迁过程可以看到,一些新服务模式的产生,是经过实践的变化演变而来的,当我们抓住了这种演变的特点并努力去适应它们,我们就可以成功实现业务模式的创新,这也是中亦科技“锻造凝练IT服务”所包含的内容之一。

管理服务

下面结合我们的系统工程师常见和常参与的工作,介绍工具和管理类服务的概念及其在运维工作中的作用。

A.什么是CMDB(配置管理数据库)?

IT基础架构中各种组件及其之间的关系,就是CMDB。这些组件不一定是IT组件,还可能包括人、文档、业务等非IT组件。

不论是客户还是服务商,在服务开始和执行过程中,为了了解维护的对象,IT基础架构,的状况,会建立和维护企业IT运维环境中设备、系统、数据库、中间件和其它软件的信息资料,同时还会建立这些软硬件的配置和内在关联关系的文档或手册,这些信息构成的文档或手册也是CMDB。

不同部门,例如设备部门,系统部门,应用部门,可能都需要自己的一份CMDB,从而帮助本部门的维护服务。所以,CMDB是多源的。

通过CMDB,可以准确分析任何变更可能造成的影响范围和程度,从而控制风险的边界,准确回答企业IT服务中,特别是业务部门提出的,诸如会影响什么业务、会影响到什么程度、影响多长时间,也可以帮助技术人员准确分析和定位问题,从而提升整体IT服务水平。

B.基础架构自动化解决方案

基础架构自动化的目的,就是要尽量将基础架构维护工作中的人工重复性工作改由自动化工具执行,以提升管理效率,减少差错。

系统工程师在做巡检和监控时需要通过执行命令和检查日志等文件,发现系统中的隐患。随着系统数量的急剧增长,人工的巡检和检查效率将大大降低而变得作用越来越小。这时,需要部署监控工具实现原来由人工进行的巡检或健康检查功能。所以,监控的价值不在监控软件本身,而在于它所满足的运维管理需求。所以,没有对自身运维管理需求的透彻了解,片面追求监控软件的独特功能和监控范围的项目,往往最终的效果不理想。

在大型客户中,系统安装部署是常规性工作。我们发现,我们经常需要根据制定的版本规范进行系统或软件的安装和打补丁;需要按照配置规范设置系统参数,例如关闭什么服务、建立什么用户、设置文件系统大小、系统核心参数设置、阀值设置等;我们希望保存一些标准的系统配置模版,以便以后遇到一个不明系统时,我们可以比对这个目标系统和模版系统之间的差异,并有可能强制将目标系统配置成和模版系统一样,等等。一般来说,我们都通过脚本实现以上工作。而实际上,运维自动化软件已经为我们做好了这些准备。

所有的业务系统都存在“联机”和“批量”两种作业。对于批量作业,简单举一个例子:银行网点每天晚上有一个“关门”动作,数据中心的一些加工工作必须在每个网点执行了“关门”动作并且所有业务人员都签退后才能开始。类似这些“关门”、“签退”、后续工作等大量存在于业务系统中。当企业只有几个业务时,这些批量工作在程序内部处理即可,出现问题也只要检查系统日志就能解决。但当业务系统几十上百个时,批量作业数量可能达到几千上万,就需要一种直观和统一的工具来管理,这就是自动化调度工具的作用。原则上,批量作业是那些跨任务的作业,即前一个任务要结束到后一个任务要开始之间,需要做的那些工作。

企业的很多基础软硬件产品都为客户提供了自动化操作可能,深入研究这些可能的自动化领域,将使企业在应对IT基础架构规模和复杂性迅速增长时得心应手,从容不迫。

C.虚拟化服务

虚拟化的基本概念就是将硬件资源虚拟成可管理的多个逻辑资源,如将一台物理主机虚拟成多个逻辑的服务器、将CPU、板卡、网络等物理资源虚拟成多个逻辑资源。面对云计

算和虚拟化浪潮,客户迫切需要做的是将这些不同的虚拟化技术整合起来,为业务提供整合好的通用的“服务能力”,而不是零散的系统、数据库、中间件等IT组件,这就是资源型数据中心的概念。其产品可以称之为资源管理云平台,也是上面所说的资源管理自动化解决方案。

咨询服务

客户的基础架构服务中,还有很重要的一项工作,就是规范和标准的实施与落地。中亦的咨询是为了帮助客户实现标准的落地,或者说提供实施这些标准的最佳实践。在帮助客户实现标准落地的过程中,我们需要首先理解这些策略,帮助客户制定或完善相关制度文件。为了达到这些标准和咨询结果的落地,我们自身需要具有深厚的技术积累,知道这些策略可能的技术解决方案。咨询是管理和技术的融合。

基础架构大运维的内容博大精深,其主线就是将行业标准、国际先进经验及专家技能以最佳实践的方式提供给用户,最终为客户的业务服务。而这些最佳实践,包括技术的、流程的、规范的等各个方面,对所有这些内容的深度和广度的理解和掌握,决定了一个服务商和一位工程师在市场中的定位和价值。

本文来源:https://www.bwwdw.com/article/7zc2.html

Top