一致性HASH算法的JAVA兑现
一致性HASH算法的JAVA实现
一致性哈希算法是分布式系统中常用的算法。比如,一个分布式的存储系统,要将数据存储到具体的节点上,如果采用普通的hash方法,将数据映射到具体的节点上,如key%N,key是数据的key,N是机器节点数,如果有一个机器加入或退出这个集群,则所有的数据映射都无效了,如果是持久化存储则要做数据迁移,如果是分布式缓存,则其他缓存就失效了。
一致性Hash算法将 value 映射到一个 32 为的 key 值,也即是 0~2^32-1 次方的数值空间;我们可以将这个空间想象成一个首( 0 )尾( 2^32-1 )相接的圆环。
如下图所示:

一致性哈希算法是分布式系统中常用的算法。比如,一个分布式的存储系统,要将数据存储到具体的节点上,如果采用普通的hash方法,将数据映射到具体的节点上,如key%N,key是数据的key,N是机器节点数,如果有一个机器加入或退出这个集群,则所有的数据映射都无效了,如果是持久化存储则要做数据迁移,如果是分布式缓存,则其他缓存就失效了。
一致性Hash算法将 value 映射到一个 32 为的 key 值,也即是 0~2^32-1 次方的数值空间;我们可以将这个空间想象成一个首( 0 )尾( 2^32-1 )相接的圆环。
如下图所示:
package hash; import java.io.UnsupportedEncodingException; import java.nio.ByteBuffer; import java.nio.ByteOrder; import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; import java.util.*; /** * Created by IntelliJ IDEA. * User: test * Date: 12-5-24 * Time: 下午5:37 * To change this template use File | Settings | File Templates. */ public class ConsistencyHash { private TreeMap<Long,Object> nodes = null; //真实服务器节点信息 private List<Object> shards = new ArrayList(); //设置虚拟节点数目 private int VIRTUAL_NUM = 4; /** * 初始化一致环 */ public void init() { shards.add("192.168.0.0-服务器0"); shards.add("192.168.0.1-服务器1"); shards.add("192.168.0.2-服务器2"); shards.add("192.168.0.3-服务器3"); shards.add("192.168.0.4-服务器4"); nodes = new TreeMap<Long,Object>(); for(int i=0; i<shards.size(); i++) { Object shardInfo = shards.get(i); for(int j=0; j<VIRTUAL_NUM; j++) { nodes.put(hash(computeMd5("SHARD-" + i + "-NODE-" + j),j), shardInfo); } } } /** * 根据key的hash值取得服务器节点信息 * @param hash * @return */ public Object getShardInfo(long hash) { Long key = hash; SortedMap<Long, Object> tailMap=nodes.tailMap(key); if(tailMap.isEmpty()) { key = nodes.firstKey(); } else { key = tailMap.firstKey(); } return nodes.get(key); } /** * 打印圆环节点数据 */ public void printMap() { System.out.println(nodes); } /** * 根据2^32把节点分布到圆环上面。 * @param digest * @param nTime * @return */ public long hash(byte[] digest, int nTime) { long rv = ((long) (digest[3+nTime*4] & 0xFF) << 24) | ((long) (digest[2+nTime*4] & 0xFF) << 16) | ((long) (digest[1+nTime*4] & 0xFF) << 8) | (digest[0+nTime*4] & 0xFF); return rv & 0xffffffffL; /* Truncate to 32-bits */ } /** * Get the md5 of the given key. * 计算MD5值 */ public byte[] computeMd5(String k) { MessageDigest md5; try { md5 = MessageDigest.getInstance("MD5"); } catch (NoSuchAlgorithmException e) { throw new RuntimeException("MD5 not supported", e); } md5.reset(); byte[] keyBytes = null; try { keyBytes = k.getBytes("UTF-8"); } catch (UnsupportedEncodingException e) { throw new RuntimeException("Unknown string :" + k, e); } md5.update(keyBytes); return md5.digest(); } public static void main(String[] args) { Random ran = new Random(); ConsistencyHash hash = new ConsistencyHash(); hash.init(); hash.printMap(); //循环50次,是为了取50个数来测试效果,当然也可以用其他任何的数据来测试 for(int i=0; i<50; i++) { System.out.println(hash.getShardInfo(hash.hash(hash.computeMd5(String.valueOf(i)),ran.nextInt(hash.VIRTUAL_NUM)))); } } }