关于百万域名树,求思路,该如何解决

关于百万域名树,求思路
本帖最后由 zyq5945 于 2012-08-04 19:32:30 编辑 树都是XML的:    举个例子如下
<root>
www.moed.bm
<text domain="moed.bm" type="NS">
NS2.IBL.bm;NS1.IBL.bm
<text subdomain="IBL.bm" type="NS">
<text domain="IBL.bm" type="NS">NS1.IBL.bm;NS2.IBL.bm</text>
</text>
</text>
</root>


表我想这样设计:
id  a      b     type_a   count
1.然后思路是这样的,先遍历xml结点,取出他们的依赖关系,如www.moed.bm—>NS2.IBL.bm,前者为a,后者为b
2.type_a有2种值,一个是NS,代表权威服务器,一个root,代表根域名www.xx.xx
3.count代表该行的重复次数
问题来了:
1.a和b之间的指向关系中,a是不能指向自身的,难道写程序(python写,数据库是mysql)时,每次insert前都要判断a==b???效率低。。
2.count最头痛,每次插入,都要和上面的数据比,a,b,type_a三个参数一样就count+1,负责就插入。效率太低,
一百万条记录,解析后上亿啊,怎么提高效率???本人菜鸟,知道的数据库语句不多,求大家给点建议,尽量详细一点,最后100分全送出去。
------解决方案--------------------
。。。。。。。。。。。。。。。。坐等大神。。。。。。。。。。。。
------解决方案--------------------
可以试试存储过程,先实现吧,实现后效果不好再来优化都可以的。
一个比较语句计算机做起来几乎瞬间的事,不会影响多少效率的。
------解决方案--------------------
第一步依赖关系就弄不出了 。。。。汗。。。好难一个