今天突然收到一封邮件,邮件上说:“由于公司分支机构不断的扩大,所以公司的一个内部系统的访问量也大增,所以领导要求我对该系统进行必要的监控”。由于该应用是跑在 Windows Server 2008 下的 IIS 服务器上的,所以我决定对主机和服务器都进行必要的监控,监控 Windows 主机我以前实现过,可以说是轻车熟路,如果有感兴趣的朋友可以参考我博客中的 文章 。对于 IIS 服务器的监控,我还是第一次配置,由于以前配置过很多种服务器的监控,所以对我来说监控 IIS 应该不是难事,我很快就在 Cacti 的 官方论坛 找到了监控 IIS 服务器需要的相关模板,任务很快完成了,具体做法如下:
- 下载 IIS 相关监控模板。
- 在 Cacti 界面下导入相关模板。
- 创建 Host 模板(IIS Server)并把刚刚导入的图像模板添加到创建的主机模板中。
- 配置 Windows Server 端的 SNMP 服务,如果有不清楚怎么配置的朋友,请参考这个 文档。
- 在 Cacti 界面下添加设备,在 Host Template 栏中选择第3步创建的 IIS Server 模板。
- 给添加的设备创建图像,在 Device 界面下选中添加的设备,点击 “Create Graphs for this Host” 创建相关图像。
- 等待 Poller 抓取数据并生成图像。
- 大功告成!
这几天一直在深入研究 Cacti 的配置,我发现 Cacti 的功能真的很强大,而且大部分的配置和调试工作只需要在图形化的界面上做操作即可。由于公司的 Cacti 监控服务器上配置的监控端越来越多,所以有些监控端出现图形不连续的现象,调高 Cacti 的 log 等级,我在 cacti.log 文件中发现如下的警告信息:
05/25/2011 10:55:39 AM – SPINE: Poller[0] Host[46] TH[1] DS[862] WARNING: SNMP timeout detected [500 ms], ignoring host ’10.10.2.91′
05/25/2011 10:55:38 AM – SPINE: Poller[0] Host[46] TH[1] DS[862] WARNING: SNMP timeout detected [500 ms], ignoring host ’10.10.2.91′
Cacti 官方手册中给出的解释如下:
For “reasonable” timeouts, this may be related to a snmpbulkwalk issue. To change this, see Settings, Poller and lower the value for The Maximum SNMP OID’s Per SNMP Get Request. Start at a value of 2 and increase it again, if the poller starts working. (1 or less disables snmpbulkwalk) Some agent’s don’t have the horsepower to deliver that many OID’s at a time. Therefore, we can reduce the number for those older/underpowered devices.
我在 Device 配置界面下,将“Maximum OID’s Per Get Request”值设置为最小值“1”,该问题解决了。但是过了一段时间图像又开始断断续续的,而且生成的 rrd 文件中的数值都是 NaN,在监控服务器端的命令行下执行 snmpwalk 命令,发现屏幕输出跑了一些信息后停下来显示 Timeout: No Response from 10.10.2.91,这是由于网络状况不太好,所以导致 Cacti 服务没有完全获得监控端的 SNMP 信息就 Timeout 了。为了证明我的猜测,我在之前的运行的 snmpwalk 命令中加入“-t 120”选项,结果 snmpwalk 获得了完整的监控端 SNMP 信息。所以我在 Device 配置界面下设置“SNMP Timeout”值为 20000,问题彻底解决了,同时我把“Maximum OID’s Per Get Request”值又重新调整为默认值“10”。这样可以减少 Cacti 监控服务器访问监控端的 SNMP 服务的次数从而提高性能。如果你的网络状况很好的情况下,你可以进一步的调高“Maximum OID’s Per Get Request”值。
Cacti 服务自带的轮询脚本(cmd.php)性能低下,如果监控点多的话,平均5分钟脚本有可能执行不完,经常导致图形断断续续,所以我推荐大家采用 spine,它的效率要高于 cmd.php 脚本。由于Cacti 服务需要写 rrd 文件记录监控信息,所以在监控点多的情况下,会经常性遇到 Disk I/O 的性能瓶颈。所以对 Cacti 监控服务器进行一定的性能优化配置十分有必要。下面我来介绍几个性能优化技巧:

最近工作中遇到这么个事,由于公司有几个服务是跑在 Windows Server 2008 的机器上,所以有必要用之前配置的 Cacti 监控下 Windows Server 2008,但是我在配置的时候发现 Cacti 自带的两个 Windows 相关的模板都不能实现对 Windows Server 2008 的监控。没办法我只有自己去 Cacti 的论坛上去找办法,费了九牛二虎的力气终于让我在这个 主题 下找到了解决方案。其详细的配置流程如下:
- 在 Windows 端安装 Windows 的 SNMP 服务,安装并配置。有疑问的朋友可以参考这篇 文章。
- 在 Windows 端安装 SNMP Informant,图形化的安装界面很简单,这里 提供 SNMP Informant 的下载
- 下载最新版本的监控模板。
- 在监控服务器端将 snmp_informant_*.xml 的文件放入 cacti/resource/snmp_queries 文件夹中,注意修改相应的文件所有者及权限。
- 在 Web 浏览器中登录 Cacti,导入 cacti_data_query_w32_*.xml 文件。
- 创建 Windows Server 2008 主机模板。
- 添加监控主机并应用新创建的 Windows Server 2008 主机模板。
- 大功告成!~
上周的主要工作就是在公司的一台戴尔服务器上安装配置 Cacti,从而实现对公司所有的服务器及其应用的实时监控,在安装配置 Cacti 的过程中,我遇到了很多大大小小的问题,总之这些错误让我受益匪浅,所以我决定把安装配置的详细过程都写出来,希望能帮助到跟我有同样任务的朋友们,让他们少走些弯路,我在安装配置过程中遇到的错误,我也会一一提出并给出解决方案。需要说明的是配置安装 Cacti 的服务器是64位,所以一些 rpm 安装包我选用的都是 x86_64 安装包。所有下载的安装包,我都放在了服务器上的“/root/monitor”目录下。 现在,让我们开始 Cacti 的配置旅程吧!
Categories
- 信息世界 | IT (95)
- Certification (1)
- Cloud Computing (1)
- Database (16)
- Google (10)
- Hardware (2)
- J2EE (4)
- Network (19)
- OS (18)
- Programming (11)
- Virtualization (1)
- Webmaster (11)
- 数码先锋 | Digital (17)
- 时事评论 | Event (5)
- 时光飞驰 | News (2)
- 杂七杂八 | Mix (2)
- 流金岁月 | Life (8)
- 游戏志 | Game (13)
- 看电影 | Movie (10)
- 红魔拥趸 | ManUtd (5)
- 读书频道 | Reading (1)
- 音乐无限 | Music (4)
- 信息世界 | IT (95)
Twitter
- I'm at 大连国美电器胜利新活馆 (大连市, 辽宁省) http://t.co/f7pxcNfg 18 小时前
- I'm at Xinghai Square | 星海广场 (Dalian, China) http://t.co/gKNqq2qV 24 小时前
- I'm at 壹品星海 (Dalian, China) http://t.co/o7SCCIrG 24 小时前
- 晚上和以前的同事喝了点酒,准备睡觉了,希望明天能把公司的电脑修好,没有电脑办公还真不方便,不知道明天印度那边有没有培训的消息。 2012-05-16
- 非常值得读的一本书! http://t.co/lV8ulDnV 2012-05-16
- I'm at 大连软件园15号楼 (大连市, 辽宁省) http://t.co/03DYYUKY 2012-05-16
- @yamiugly 好奇你做的是什么工作? 2012-05-16
- I'm at 壹品星海 (Dalian, China) http://t.co/frkQvlIn 2012-05-15
- I just ousted @fndhrt as the mayor of 大连软件园15号楼 on @foursquare! http://t.co/yn7fSLY6 2012-05-15
- I'm at 大连软件园15号楼 (大连市, 辽宁省) http://t.co/KH2m2Z4R 2012-05-15
- @terrysosi_chan 小日子过的太充实了! 2012-05-15
- RT @GossipSama: 玩diablo 2的时候我23岁,玩diablo 3的时候我34岁。暴雪是要等我不再2了才出3是么?那是不是要45岁才玩到4? 2012-05-15
- I'm at 中山广场 Zhongshan Circus (大连, 中国) http://t.co/fiD6vqHS 2012-05-14
- 英超还真他妈的好看。昨晚90分钟的比赛,跟坐过山车一样,如果不看直播,是体会不到这种刺激的,呵呵,英超第20年,今年的冠军真的很有戏剧性,恭喜曼城,明年的曼联面对的局势更难,曼城还会加大投入的,看看曼城现在的阵容,明年再买几个强援,大耳朵杯指日可待! 2012-05-14
- @Fatal1tyV 怎么弄? 2012-05-14
Latest Comments
Foursquare Checkins
标签
