Tomcat在同一台Windwos机器上集群session不复制的有关问题

Tomcat在同一台Windwos机器下集群session不复制的问题
最近由于有个应用要发布,考虑到这个应用的session数据很小,只有用户的登录信息,且用户对系统能提供不间断的服务需求也是有的,所以就想以集群的方式进行部署。没想到在服务器(Linux系统)上部署好了之后,想要在自己的笔记本上也搭建一个的时候,居然弄了大半天都,google上也不见有类似的问题,呵呵,想必用Tomcat的,且搞集群的在Windows比较少吧。后面下载了Tomcat的源码(svn地址:https://svn.apache.org/repos/asf/tomcat/tc6.0.x/tags/TOMCAT_6_0_20)测试、分析了一轮,终于得以解决。

我的情况是WinXP SP3,起了两个Tomcat,版本6.0.20,但是两个都出现: Manager [localhost#/examples]: skipping state transfer. No members active in cluster group.
这证明了两个没有互相找到对方。

初步判断是数据没发送或没接收到。于是找到Tomcat用于处理集群 session同步的处理类:org.apache.catalina.tribes.membership.McastService和 org.apache.catalina.tribes.membership.McastServiceImpl,先是把断点设置在数据发送函数,发现这个函数正常执行,证明数据已正常发送。再把断点设置在数据接收函数里,结果没能接收到任何数据。但是为何接收不到数据呢?怀疑过Windows是不是有什么组播的设置、防火墙等等系统方面的原因,但是N次google之后,还是没能解决。后面想Tomcat对socket是不是有些特别的设置了,先一个简单程序看看能不能接收先,于是ctrl+v了下面的一段代码:

public static void testServer() throws Exception {
        // Create a multicast datagram socket for receiving IP
        // multicast packets. Join the multicast group at
        // 230.0.0.1, port 7777.
        MulticastSocket multicastSocket = new MulticastSocket(45564);
      
        // 如果对端绑定的是127.0.0.1,则这里也是127.0.0.1才能收到
        multicastSocket.setInterface( InetAddress.getByName("134.192.124.250") );
      
        multicastSocket.setSoTimeout(500);
        InetAddress inetAddress = InetAddress.getByName("228.0.0.4");
        multicastSocket.joinGroup(inetAddress);


        // Loop forever and receive messages from clients. Print
        // the received messages.
        while (true) {
            System.out.println("!!!!!!");
            byte[] arb = new byte[2048];
            DatagramPacket datagramPacket = new DatagramPacket(arb, arb.length);
            try {
                multicastSocket.receive(datagramPacket);
                System.out.println( String.valueOf(datagramPacket.getLength()) + new String(arb));
                System.out.println("#" + datagramPacket.getAddress() + "#" + datagramPacket.getSocketAddress() + "#");
            } catch(java.net.SocketTimeoutException e) {
              
            }
        }
    }

嘿,一运行,发现它居然能收到Tomcat发出的组播数据包,立马再比对Tomcat的代码,经过多次尝试后,终于发现如果屏蔽setupSocket()中的socket.setLoopbackMode(true);就可以收到,呵呵,找到罪魁祸首了。后面查到一篇文章,说如果在Linux下必须要 disable Loopback Mode,而在Windows下disable的话,则不能接收本机同端口的数据。^_^,看来Tomcat开发人员是在Linux下干活的。

这个问题修正还是蛮简单的,在McastService下增加一个函数:

public void setLoopbackMode(boolean loopbackMode) {
        properties.setProperty("loopbackMode", String.valueOf(loopbackMode));
    }

同时修改mbeans-descriptors.xml,增加:

<attribute   name="loopbackMode"
          description="Membership loopback enabled"
                   is="true"
                 type="boolean"/>

这样loopbackMode就可以通过配置的形式 传入了,改动之后的配置如下:
<Membership className="org.apache.catalina.tribes.membership.McastService"
                        address="228.0.0.4"
                        bind="127.0.0.1"
                        port="45564"
                        frequency="500"
                        dropTime="3000"
                        loopbackMode="false" />


当然,如果你懒得下载Tomcat源码进行修改,这里(http://download.csdn.net/source/1885606)有我改好的一个jar包,替换掉$TOMCAT_HOME/lib下的就可以了