
最近公司的 OA 系统出现性能问题,虽然问题的根源是应用中的签报系统采用的是 JBPM 框架,该框架在数据库设计方面的低效的惊人,但是在新的签报系统开发出来之前,作为系统运维人员的我们只能先采取其他曲线救国的方式来减少性能问题发生的可能性,所以就有了 OA 系统集群测试环境的搭建这个项目,这篇博文的诞生也拜该项目所赐。配置过程中费了老大的劲,尝试了很多种配置方式,其中的艰辛我就不说了,至少结果是好的。由于公司的 OA 系统是在 Liferay Portal 定制开发的,所以该集群测试环境的搭建也主要是围绕着 Liferay Portal 以及 Apache,Tomcat 来进行。我就不废话了,下面详细介绍 Liferay Portal 集群配置过程:
1. 启动 RHCS 集群
RHCS集群的核心进程有 cman 和 rgmanager,要启动集群,依次在集群的每个节点执行如下命令即可:
[root@web1 ~]# service cman start
[root@web1 ~]# service rgmanager start
需要注意的是,执行这两个命令是有先后顺序的,需要首先启动 cman,然后在启动 rgmanager。在集群所有节点成功启动 cman 服务后,然后继续依次在每个节点启动 rgmanager 服务。
2. 关闭 RHCS 集群
与启动集群服务刚好相反,关闭RHCS集群的命令为:
[root@web1 ~]# service rgmanager stop
[root@web1 ~]# service cman stop
首先在集群的每个节点依次关闭 rgmanager 服务,等待所有节点的 rgmanager 服务成功关闭后,再依次关闭每个节点的 cman 服务即可完成整个集群服务的关闭。
有时在关闭 cman 服务时,可能会提示关闭失败,此时可以检查本机的共享存储 GFS2 文件系统是否已经卸载,还可以检查其它节点的 rgmanager 服务是否都已经正常关闭。
… …
由于前段时间一直在准备 OCP 的认证考试,所以领导十分 nice 的一直没有给我分配复杂的工作。原先安排的搭建 Oracle HA 环境的实验任务也允许我考完试后再做,国庆假日回来我终于有时间把这部分任务完成了。由于之前在相同的机器上做过 Oracle RAC 的实验,所以卸载的过程中对 CRS 组件没有彻底删除,所以导致我走了不少的弯路,还把机器弄挂一次,为此我还特意跑去 IDC 重装了一次系统。嘿嘿,不抱怨了,至少 HA 环境成功的搭建了起来,结果还是令人满意的。(#^_^#)
下面我来详细介绍一下具体的配置过程:
1. 网络配置
具体的网络配置过程我就不在这里罗嗦了,基本跟 Oracle RAC 相同,每个节点两个网卡其中一个做心跳线。两个节点的 /etc/hosts 配置文件内容一致,内容如下:
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1 localhost.localdomain localhost
10.10.6.203 testrac1
192.168.122.101 testrac1-priv10.10.6.207 testrac2
192.168.122.102 testrac2-priv10.10.6.208 testHA
… …
今天突然收到一封邮件,邮件上说:“由于公司分支机构不断的扩大,所以公司的一个内部系统的访问量也大增,所以领导要求我对该系统进行必要的监控”。由于该应用是跑在 Windows Server 2008 下的 IIS 服务器上的,所以我决定对主机和服务器都进行必要的监控,监控 Windows 主机我以前实现过,可以说是轻车熟路,如果有感兴趣的朋友可以参考我博客中的 文章 。对于 IIS 服务器的监控,我还是第一次配置,由于以前配置过很多种服务器的监控,所以对我来说监控 IIS 应该不是难事,我很快就在 Cacti 的 官方论坛 找到了监控 IIS 服务器需要的相关模板,任务很快完成了,具体做法如下:
- 下载 IIS 相关监控模板。
- 在 Cacti 界面下导入相关模板。
- 创建 Host 模板(IIS Server)并把刚刚导入的图像模板添加到创建的主机模板中。
- 配置 Windows Server 端的 SNMP 服务,如果有不清楚怎么配置的朋友,请参考这个 文档。
- 在 Cacti 界面下添加设备,在 Host Template 栏中选择第3步创建的 IIS Server 模板。
- 给添加的设备创建图像,在 Device 界面下选中添加的设备,点击 “Create Graphs for this Host” 创建相关图像。
- 等待 Poller 抓取数据并生成图像。
- 大功告成!

前一阵研究了一大顿 Cacti,遇到了很多大大小小的问题,而这些问题基本都让我在 Cacti 的官方论坛里找到了答案,我觉得 Cacti 手册中的 Debugging 章节还是比较不错的。我的总结如下:
1. Check Cacti Log File
… …
前几天刚刚搭建好的 Nagios 环境就是为了实现监控公司所有生产系统的 http 服务,这几天我在公司的主要工作包括:配置 Nagios 主机与相关服务,配置相关报警联系人与联系人组,改写相关 Nagios 插件,编写 Shell 脚本以便调用公司的短信中心的 Web Service 接口发送报警短信。总结一下:Nagios 并不高深,但是很复杂,太多太多的配置项,这也是 Nagios 灵活性的表现。举个简单的例子:光是报警通知这个事件就要通过7个不同的过滤器来决定是否发送,你可以想象 Nagios 的配置是多么让人闹心的一件事。不过不幸中的万幸,Nagios 提供的模板机制,在配置的过程中使用相关的模板会让配置人员减少一定的工作量。不过如果需求很细化的话,就需要配置人员认真配置好相关配置项,而不是用默认的配置项。下面我们进入正题,以下是我的具体配置过程:

本周的工作是做 Nagios 监控系统的初期调研,看了大量的网上资料,我初步确定 Nagios 的功能确实很强大,相比之前我搭建的 Cacti 监控系统,Nagios 监控服务器的状态更强大,并且报警功能也很不错,但对像流量这样的持续数据的展现能力却比较弱,不像 Cacti 监控系统将服务器的点状态和线状态都清晰的展现出来。所以我的研究表明,公司同时使用这两种监控系统是有必要的,而且我从网上找到了一种将 Nagios 整合到 Cacti 监控系统中的方法,如果这个方法行得通的话,公司的监控系统就完美了!具体的实现方法我会在自己测试后以博文的形式发布到我的博客里,下面就请大家跟我一起开始 Nagios 的安装旅程吧!
公司一直使用 JBoss 应用服务器作为公司网站和核心系统的 Web 容器,所以利用我最近搭建的 Cacti 监控系统来对 JBoss 服务进行一定的监控是有必要的,在 Cacti 官方论坛上找到了一篇帖子来实现对 JBoss 服务器的监控,它主要利用 JBoss 服务器的 all 配置目录下的 snmp-adaptor 中间件来实现对 JBoss 应用的一些信息的读取。具体的做法如下:
1. 拷贝 ../server/all/snmp-adaptor.sar 文件夹到应用的 *.war 文件夹下.
2. 在 Cacti 界面下导入 Cacti-JBoss-Templates.xml 模板。作者对该模板的描述如下:
This file will create 3 Graph Templates (JBoss – Active Thread Count, JBoss – Memory Utilization, and JBoss – Transaction Manager), 1 Host Template (JBoss SNMP Adaptor), and 5 Data Templates (JBoss – Active Thread Count, JBoss – Free Memory, JBoss – Max Memory, JBoss – Transaction Commit Count, etc.).
3. 在 Cacti 界面下添加设备,在 Host Template 栏中选择 JBoss SNMP Adaptor 模板。值得注意的是 snmp-adaptor.sar 中间件使用的 SNMP 端口号是1161,而不是默认的161。所以请在添加设备时更改 SNMP Options 中的 SNMP Port 为 1161。
4. 给添加的设备创建图像,在 Device 界面下选中添加的设备,点击 “Create Graphs for this Host” 创建相关图像。
5. 等待 Poller 抓取数据并生成图像,大功告成!
Via Cacti Forums
Categories
- 信息世界 | IT (85)
- Certification (1)
- Database (15)
- Google (10)
- Hardware (2)
- J2EE (4)
- Network (17)
- OS (17)
- Programming (11)
- Virtualization (1)
- Webmaster (5)
- 数码先锋 | Digital (15)
- 时事评论 | Event (5)
- 时光飞驰 | News (2)
- 杂七杂八 | Mix (2)
- 流金岁月 | Life (9)
- 游戏志 | Game (13)
- 看电影 | Movie (10)
- 红魔拥趸 | ManUtd (5)
- 读书频道 | Reading (1)
- 音乐无限 | Music (5)
- 信息世界 | IT (85)
Latest Comments
- Robin 发表在《查看已经安装的 Perl 模块》
- xiaochuanjiejie 发表在《查看已经安装的 Perl 模块》
- 马继军 发表在《About Me》
- Robin 发表在《在 Cacti 下实现对 Tomcat 的监控》
- 酱油 发表在《在 Cacti 下实现对 Tomcat 的监控》
- dream 发表在《理解 pkg-config 工具》
Twitter
- Chenjunlu’s Blog: 在 MIUI 系统下开启 App2SD+ 功能 http://t.co/t6F5HiRm 2012-02-15
- Chenjunlu’s Blog: 虚拟化 hypervisor 的类型对比 http://t.co/T7hvle03 2012-01-31
- I'm at 公主岭 (Siping) http://t.co/mpEU711u 2012-01-27
- 好像又没动静了。 2012-01-09
- I'm at 宜家家居 IKEA (Dalian) http://t.co/MJWDZt3g 2012-01-07
- I'm at 中山广场 Zhongshan Circus (大连) http://t.co/MyBQWjOF 2012-01-04
- I'm at Changchun Railway Station 长春站 (长白路5号, 长春市) http://t.co/sdcmprTJ 2012-01-03
- I'm at 万达广场 (Shenyang) http://t.co/EfAqBrNn 2011-12-31
- Chenjunlu’s Blog: Liferay Portal 集群配置指南 http://t.co/ANxjlSID 2011-12-26
- I'm at 壹品星海 (Dalian, China) http://t.co/knlcVidX 2011-12-14
- I'm at 五殼日本料理 (Dalian) http://t.co/Zocw45vI 2011-12-10
- I just became the mayor of 五殼日本料理 on @foursquare! http://t.co/rfHazBzj 2011-12-10
- I'm at 壹品星海 (Dalian, China) http://t.co/hQH7xCNa 2011-12-10
- I'm at 奥林匹克广场 Olympics Square (五四路, 大连) http://t.co/BWEGsBpt 2011-12-02
- Chenjunlu’s Blog: Kindle Keyboard 上手玩 http://t.co/hhN6HoN4 2011-12-02
豆瓣生活
Foursquare Checkins
标签
Android Apache Apple Cacti CPAN Digital Signature England Excel VBA Facebook Froyo Google Gravatar HA HTC Desire httpd https IBM iPad J2EE Java JBoss Konami Linux Man Utd Oracle Perl PES2011 Playstation Premier League PSP Red Hat RHCS RHEL RMAN Rooney RSA Secure Shell SNMP South Africa 2010 ssh Windows World Cup 人生 桌游 爱电影
