INSPUR_SSM_V6.0_R1_产品白皮书

更新时间:2023-08-25 15:26:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Inspur SSM V6.0 R2 业务监控中心-产品白皮书

2012.6

北京浪潮嘉信计算机信息技术有限公司

声 明

本资料著作权属北京浪潮嘉信计算机信息技术有限公司所有。未经本公司书面许可,

任何单位或个人不得以任何方式摘录、复制或翻译,并不得以任何形式传播。

是北京浪潮嘉信计算机信息技术有限公司的注册商

标。在本手册中出现的其他公司的商标、产品标识及商品名称,由各自权利人拥有。

本手册仅作为使用指导,本手册中的所有陈述、信息和建议不构成任何明示或暗示的担保。

技术支持

热线电话:010-82581198

邮箱:wangjiaqing@http://www.77cn.com.cn 公司网址:http://www.77cn.com.cn

前 言

北京浪潮嘉信计算机信息技术有限公司自主研发的业务监控系统(Inspur SSM)定位于对网络中的应用服务、网络设备、安全设备以及基础支撑系统的运行状况的监测、性能的管理以及故障的监控。它通过持续对各项资源运行状况的监控,建立性能基线,发现系统中的异常并且及时告警;有效提高了各类资源运行维护的工作效率和服务质量,保障企业的综合信息平台健康有序运行。

《Inspur SSM V6.0 R2产品白皮书》主要针对SSM的产品架构、产品功能与产品特点进行介绍,是公司对外宣传与技术人员了解Inspur SSM V6.0 R2产品的最佳技术参考资料。

内容说明

《Inspur SSM V6.0 R2 技术白皮书》全书共分为6章。

本书约定

介绍符号的约定、键盘操作约定、鼠标操作约定。 符号约定

带尖括号“<>”表示键名、按钮及操作员从终端输入的信息;带方括号“[]”表示人机界面、菜单项、数据表和字段名等,多级菜单用“→”隔开。如[开始→程序→Word2003]表示[开始]菜单栏下的[程序]子菜单下的[Word2003]菜单项。 键盘操作约定

鼠标操作约定

1. 市场背景

企业IT 系统越来越多,网络、设备和产品越来越复杂,企业的各项经营活动越来越依赖于稳定可靠的业务应用系统的支撑。面对着复杂多样的 IT 网络和业务支撑系统,信息部门面临着诸多挑战:

如何最大程度的提前发现和改善 IT系统中的不稳定因素? 如何满足信息部门复杂的IT 资源不同层面的监控和管理需求? 如何从业务角度提高质量,保证业务使用部门的满足度?

如何实现 IT 资产和运行情况的统一管理分析,为 IT 系统建设提供量化的决

策依据? ......

作为北京浪潮嘉信SSM产品系列中的业务管理产品,Inspur SSM应运而生。

2. 产品介绍

浪潮嘉信凭借多年的相关软件开发和实施经验,结合国内管理实际情况,并在充分吸收国外先进网络管理理论的基础上,研制开发出了SSM IT运维管理平台。部署该平台将帮助用户及时的发现IT系统运行中所存在的问题,做到异常事件早发现、早解决,既提高了信息系统的运行效率,又增强了企业的故障应急处理能力。

面对用户日益复杂的IT环境,SSM IT运维管理平台将以往对网络、服务器与业务应用、安全设备、客户端PC和机房基础环境等的分割管理进行了有效的整合,实现了全面监控与集中统一管理;并融入了基于ITIL理念的IT服务管理,实现了技术、功能、服务三方面的有机结合,从而提高了企业IT系统的运行管理水平和服务能力,为企业生产和日常办公提供高效、贴身的保障。

Inspur SSM作为SSM产品系列中的业务管理产品,全称应用监管系统,是浪潮嘉信在多年系统管理和服务经验积累之上,推出的第三代业务系统监控解决方案,定位于对应用服务、安全设备、网管系统、基础支撑系统等一系列资源的不间断监控,是一套能够对网络基础平台和业务支撑系统进行统一监控的业务监控管理平台。

Inspur SSM面向国内客户的业务环境和管理模式,加入了客户和市场迫切要求的重

要特性,融合了国内外的监测技术发展趋势,可满足在复杂的IT环境下实施面向业务服务的监控需求。系统为客户提供直观、全面、多角度的视图,动态预测业务应用的发展,对影响正常运转的事件快速响应,帮助信息部门建立主动化管理模式,实现对IT 资源和运维资源的高效管理,提升业务服务质量,

从而保障 IT 信息系统的可持续性发展。

图1

SSM产品概念示意图

3. 产品架构

3.1. 产品系统架构

图2

Inspur SSM系统架构图

Inspur SSM系统架构分为五层: 基础资源层

包含网络设备、服务器系统、数据库、中间件、基础应用平台、通用服务管理和基础运行环境等被监测资源。 数据采集层

数据采集层包含监测采集器、采集探针和监测数据接收几部分:

监测采集器利用HTTP、SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、

CORBA等标准协议和各种业务系统专有协议实现远程监控和数据采集,同时也支持SSM UniAgent代理式监测采集被管资源的监测数据。

监测采集器运行在采集探针(Probe)内,采集探针可以分布式部署,满足多

个隔离子网和多级大规模IT环境监测的要求。

监测数据接收模块接收各个采集探针上报的数据,并交由数据处理层统一

处理。

数据处理层

性能数据经过整理、归并与挖掘处理,为上层提供可靠参考;同时故障数据经过过滤、压缩、归并与关联分析之后,产生告警信息与事件记录。 业务模块层

提供全面业务功能支撑,展现监测分析结果。

监测配置:各类监测任务配置,监测调度和阈值管理。 资源管理:面向资源监测与数据汇总。 业务管理:业务应用与业务影响模型建模。 业务拓扑:业务拓扑视图管理 告警管理:智能告警处理与展现。

统计分析:各类数据的统计和分析报表支撑。 功能展现层

用户接入方式与WEB客户端功能展现。

3.2. 产品关键技术

Inspur SSM的产品关键技术有:

基于J2EE平台,B/S展现模式,采用先进的业务框架,良好的互操作性和扩展性,

轻松实现跨平台部署。 默认数据库为Oracle 10g。

内嵌WEB应用服务器,简化配置、优化性能、加固安全。

支持监测配置集中管理,分布式探针(Probe)监测采集部署,满足多个隔离子网和

多级大规模IT环境的统一监测管理要求。

主机监测提供远程无代理和UniAgent代理两种模式。 强大的监测插件体系,确保监测功能和指标的可扩展性。

内置智能事件分析引擎,通过业务影响依赖关联模型iBDM自动分析事件关联。

遵循各类标准化协议与规范

ICMP SNMP JMX Corba

CLI(Telnet、SSH) WBEM/WMI HTTP、HTTPS LDAP DNS

FTP/POP3/SMTP …

3.3. 产品部署模式

图3

Inspur SSM产品部署示意图

Inspur SSM产品支持分布式监测采集部署与集中配置管理模式,通过在服务端集中配置采集策略下发到采集探针(Probe)执行周期采集任务,完全可以满足在大规模网络环境下的对IT基础设施的监测要求。客户端无需任何安装,直接通过浏览器查看各类IT

资源的即时性能指标,方便快捷。

SSM系统采集探针(Probe)具有以下几大特性:

探针自带监测数据存储功能:在网络临时中断或服务端临时关闭的情况下,

Probe端会临时存储监测数据(Probe关闭后也不会丢),待网络和服务端恢复后再向服务端传输数据,保证监测数据的完整性。

探针支持自我管理和故障自恢复:当采集探针由于某些原因无法正确运行时,

探针会自动重启并迅速执行监测任务,保证监测数据的连续性。

探针支持自动升级功能:当探针有新版本发布时,只需要把探针升级程序发布

到服务端固定的目录,探针会自行判断并升级到新版本,减少手工升级带来的成本和出错几率。

探针提供自动注册功能:采集探针在启动时会自动根据配置信息连接到服务端

进行自动注册,增加了管理的方便性。

探针支持多种常见平台部署:采集探针可在Windows和常见类Unix操作系统

下部署,并能以服务模式运行(默认提供Windows操作系统下的安装程序)。

4. 产品功能

4.1. 深度全面的资源监测

Inspur SSM集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等远程监控手段和SSM UniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7X24不间断监控。 强大监测插件体系

无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。众多监测器工作独立,互不影响,保证整个监测体系的稳定运行。 灵活的监测时间调度机制和智能化的监测阈值模型

自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。

主机代理Agent监测和远程无代理监测两种监测模式

多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。

4.1.1. 网络安全设备管理

全面支持CISCO、华为、中兴、北电、Foundry、Extreme、Avaya、H3C 、DLink 等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU / MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。

图4 CISCO路由器监控详细视图

网络设备监测项包括:

设备CPU利用率:监测网络设备的CPU使用率。

设备内存利用率:监测网络设备的内存使用量、内存使用率。

端口速率监测:监测网络设备中指定端口的入速率、出速率、入丢帧速、出丢帧速、

单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速。

端口上下线监测:监测网络设备指定的端口的上下线状态。

自定义SNMP监测:可监测多个SNMP表达式(支持四则运算、时间差值运算等)

对应的采集结果。

ICMP连通性监测:监测与网络设备的连通性。 ……

4.1.2. 服务器系统管理

管理和监测Windows、Linux、IBM AIX、AS/400、HP-UX、SUN Solaris、SCO Unix 、SGI、Tru64等不同操作系统的服务器或集群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。帮助用户及早发现服务器系统的性能瓶颈与故障隐患。

图5. Solaris监控详细视图

服务器监测项包括:

主机基本信息采集:主机的基本信息,包括:CPU数目、机器型号、系统名称、系

统版本、IP地址、内存大小、总线程数目、磁盘名称等。 主机CPU使用率:监测主机系统的CPU使用率。

主机内存使用率:监测主机系统的内存使用量、内存使用率。 主机磁盘使用率:监测主机系统的指定磁盘使用率。

主机磁盘IO监测:监测主机系统的磁盘TPS数、磁盘写操作速率等、每秒完成IO

读写次数、每秒读写扇区数、每秒读K字节数、平均I/O队列长度等。

应用进程监测:监测主机系统中指定应用进程的内存使用量、内存使用率、CPU使

用率。

系统服务监测:监测主机系统中指定服务的运行状态

主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、终端名称

主机端口速率监测:监测主机系统中指定端口的入速率、出速率、入丢帧速、出丢

帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。

主机重要文件监测:监测主机系统中指定的文件大小。

Job基本信息采集(AS/400):监测Job的名称、CPU使用率、类型、状态、所属用

户等。

ICMP连通性监测:监测与主机的连通性。

HACMP集群状态监测:监测集群的可用状态及子节点的状态。

自定义指标监测:系统提供了通用监测器,用户可以通过编写shell或者groovy脚

本自定义监测指标 ……

4.1.3. 数据库及中间件管理

根据预定义的监测项目对Oracle、SQL Server、Sybase、DB2、Informix 、MySQL等多种数据库,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。

图6. Oracle监控详细视图

DB2数据库监测

基础监测:最后一次备份时间、数据库状态、数据库激活时间、当前连接数、

连接总次数

缓冲池信息监测:各缓冲读写次数、命中率

锁监测:死锁数、锁等待率、锁升级率 锁表信息:锁状态、锁模式、表空间、Schema 排序信息监测:应用排序数、排序溢出百分比

表空间监测:已使用页、表空间类型、页长、总页数、表空间状态、空闲率、

空闲页、使用率、预取大小、扩展数据块大小

表空间容器监测:使用率、总页数、已使用页、容器类型、表空间名称

Oracle数据库监测

基础监测:表空间使用率、连接会话数

高级队列监测:ready消息数、错误的消息数、消息平均访问时间、消息总数 归档目的地监测:归档目的地类型、归档目的地状态、归档目的地可用空间、

归档目的地可用空间百分比、归档目的地位置

基本信息采集:使用spfile启动、只读模式、归档路径、例程开始时间、限制

模式、归档模式、例程名、并行状态、位长、DB版本、DB名称、主机名、实例状态

检查点监测:发生检查点数、完成检查点数

数据文件监测:文件大小、读次数、写次数、读时间、写文件块数、读文件块

数、读写文件块数、写时间

全表扫描配置: RSRATIO值、LTSCANRATIO值 资源锁定监测:锁定时长 碎片监测: FSFI值

PGA配置:PGA内存及各区域大小、实例处理性能等

进程资源消耗监测: 可用PGA百分比、可用PGA、已分配PGA、已使用PGA 命中率监测:共享区字典缓存区命中率、多次解析(重装)的条目比率、高速缓

存区命中率、共享区库缓存区命中率、磁盘排序与内存排序比率、回退段等待次数与获取次数比率

递归调用信息监测: 递归调用百分比、时间间隔的递归调用百分比、用户调

用数、递归调用数、递归-用户调用比率、递归调用速率

Redo日志配置:重做条目的平台大小、多种请求成功/失败比率、错误次数等 Rman备份监测: 增量备份大小、全备份大小

回滚段:大小命中率、等待率、等待次数、活动事务数、翻转次数 、扩展次

数、一致更改率、收缩次数、用户回滚率

会话监测:会话ID、用户名、CPU时间、排序次数、缓冲区命中率、读次数、

写次数、提交次数、占用游标数、扫描次数

SGA配置:共享库缓存大小、SQL缓存大小、数据字典缓存大小、共享池大小、

重做日志缓冲区大小、高速缓冲区大小

SQL监测:使用内存、执行时间、SQL语句、用户 转存空间监测:转储空间使用率

表空间监测:未使用Extent数量读时间、最大Extent数量、已使用率、已使用

量、未使用量、未使用百分率、允许最大空间、是否自动扩展、写时间、Segment管理方式、表空间类型、当前Extent数量、下一个Extent大小 表状态监测:增长速度、索引大小、数据大小、表空间、用户 撤销空间监测状态监测:快照太旧错误计数、无空间计数

作业队列监测:破损作业数量、过期作业数量、失败作业数量 MySQL数据库监测

基础监测:缓存查询数、连接数 数据库大小监测:数据库大小 SQL Serve

基础监测:连接会话数、CPU使用率、数据文件大小、日志文件大小 基本信息:阻塞进程数、处理器名称、Windows版本、处理器数目、主机名、

内存(MB)、数据库数目、会话数目、启动时间

数据库大小:数据大小、数据库大小、未分配大小、未使用大小、索引大小、

保留大小

文件监测:路径、增长方式、容量、文件组、数据库、大小

会话监测:最后处理时间、命令、数据库、CPU时间(ms)、内存(KB)、程序、

建立时间、用户、状态、主机

Informix数据库监测

基础监测:回滚数、死锁数、写缓存命中率、读缓存命中率、数据库连接数 检查点监测:检查点速率、检查点等待速率 DbSpace监测:数据空间使用率

磁盘读写监测:页写速率、页读速率、物理磁盘写速率、物理磁盘读速率 锁监测:锁请求速率、锁超时率、锁等待率、死锁率

日志读写监测:物理日志页面写速率、物理日志写速率、逻辑日志页面写速率、

逻辑日志写速率、逻辑日志记录写速率

共享内存监测:块写速率、缓冲区写命中率、缓冲刷新到磁盘速率、Foreground

写速、缓冲区等待速率、LRU写速率、顺序扫描速率、Latch等待速率、缓冲区读命中率

排序监测:内存排序速率、磁盘排序速率 事务监测:事务提交速率、事务回滚速率

Sybase数据库监测

基本信息采集:DBMS名称、DBMS版本、系统信息、产品版本、主版本号、

产品名称、次版本号

数据库监测:使用百分比、已使用大小、数据大小、空间大小、索引大小、未

使用段大小、数据段大小、段总大小、索引段大小

会话监测:数据库、命令、已用内存、CPU时间、IO读写次数、程序、主机、

用户、状态

事务监测:系统事务交易总数、每秒回滚事务数、每秒事务数 设备监测:属性值

数据库:CPU使用率、数据库空闲表空间、数据库表空间、连接会话数

产品还支持对Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb、金蝶Apusic等各类不同中间件,提供包括配置信息、连接池、线程队列、负载监测、通道情况监测等多类监测组,分析与监测中间件的各项运行状态参数。

本文来源:https://www.bwwdw.com/article/j9ei.html

Top