监控易一体化运维软件自身过硬
监控易产品所有底层均使用C语言开发设计,达到了系统级的健壮可靠,首先保证了在处理大规模监控时系统本身不会出现问题,持续、稳定可用。
从监测器到数据库、Web中间件等,监控易均为自主技术研发、一体化设计,系统各组件之间为紧耦合状态。这从架构上保证了逻辑关系清晰,工作流程优化,事务处理。
也正是因为不使用第三方组件,使得监控易所有模块协同良好、整体效率非常高。
监控易一体化运维基础设施
状态监控包括机房供电、空调、网络设备的软硬件状态,如设备状态等
性能监控包括设备的性能情况,比如CPU、内存大小、session数量、端口流量包量、内存溢出监控、内存使用率等;
网络监控包括设备错包、丢包率,针对网络设备以及网络链路的探测、丢包率监控等;
容量监控包括设备负载使用率、专线带宽使用率、出口流量分布等;
由于基础设施硬件往往已有设备健康性的检测机制,建议向这类厂商提要求,将设备的运行事件主动送到监控平台整合。
监控易服务器层
存储:包括存储设备,以及设备上的硬盘读写错误、读写超时、硬盘掉线、硬盘介质错误;
服务器上的内存(内存缺失、内存配置错误、内存不可用、内存校验)、网卡(网卡速率;电源:电源电压、电源模块是否失效)、风扇(风扇转速等)、Raid卡(Raid卡电池状态、电池老化、电池和缓存是否在位、缓存策略)
虚拟机:vcenter等
容器:docker等
存储、物理设备、虚拟机等建议参考基础设施层由厂商主动汇总事件到监控平台,由于容器方面的监控工具并不多,则需根据实际情况选择是否借鉴开源的工具进行自研。
监控易系统服务层
系统服务层的数据主要包括操作系统、中间件、数据库,以及其它开源分布式中间件等工具,这方面包括很多,以操作系统为例,包括:CPU(CPU整体使用率、CPU各核使用率、CPU Load负载)、内存(应用内存、整体内存、Swap等)、磁盘IO(读写速率、IOPS、平均等待、平均服务等)、网络IO(流量、包量、错包、丢包)、连接(各种状态的TCP连接数等)、进程端口存活、文件句柄数、进程数、内网探测、丢包率等。
版权所有©2025 产品网