小弟我的监控世界观(1)

我的监控世界观(1)

写给其它还在为此苦恼的朋友们

监控系统设计的目的是什么?

我认为监控系统的目的是为了我们全面的了解我们的机器,系统的运行状态,以作出相应的判断和动作。

监控系统设计的核心点是什么?

1) 采集状态
2) 状态判断
3) 报警(或者触发某种动作)
4) 图表展示(报表)

从经验来看,这4条的实现的难易程度,由难到易刚好是1,2  -> 3,4

监控系统的分类:

按紧急程度而言可分为2类
1) 周期性监控
2) 事件监控 (事件报警)

顾名思义,周期性监控一般是1分钟或5分钟来采集系统的状态,以cacti和nagios为代表
而事件监控一般是由被监控主体自主上报的某种事件,以sentry为代表(nagios的NRPE中也有trap)
它们适用于不同的场景,没有优劣之分

如果按照功能划分,又可分为:
1) 安全监控
2) 主机监控
3) 应用监控
4) 网络监控等等

有趣的规律:

以主机监控举例,早期的不少公司都是使用开源的监控软件作为工具,比如:cacati,nagios, ganglia,当物理机数量达到800~1000台左右时(我推测的),都逐步使用自己的开发的监控系统替换开源的监控软件