关于百万域名树，求思路,该如何解决

关于百万域名树，求思路
本帖最后由 zyq5945 于 2012-08-04 19:32:30 编辑树都是XML的：举个例子如下

<root>

www.moed.bm

<text domain="moed.bm" type="NS">

NS2.IBL.bm;NS1.IBL.bm

<text subdomain="IBL.bm" type="NS">

			<text domain="IBL.bm" type="NS">NS1.IBL.bm;NS2.IBL.bm</text>

		</text>

	</text>

</root>

表我想这样设计：
id a b type_a count
1.然后思路是这样的，先遍历xml结点，取出他们的依赖关系，如www.moed.bm—>NS2.IBL.bm,前者为a，后者为b
2.type_a有2种值，一个是NS，代表权威服务器，一个root，代表根域名www.xx.xx
3.count代表该行的重复次数
问题来了：
1.a和b之间的指向关系中，a是不能指向自身的，难道写程序（python写，数据库是mysql）时，每次insert前都要判断a==b？？？效率低。。
2.count最头痛，每次插入，都要和上面的数据比，a,b,type_a三个参数一样就count+1，负责就插入。效率太低，
一百万条记录，解析后上亿啊，怎么提高效率？？？本人菜鸟，知道的数据库语句不多，求大家给点建议，尽量详细一点，最后100分全送出去。
------解决方案--------------------
。。。。。。。。。。。。。。。。坐等大神。。。。。。。。。。。。
------解决方案--------------------
可以试试存储过程，先实现吧，实现后效果不好再来优化都可以的。
一个比较语句计算机做起来几乎瞬间的事，不会影响多少效率的。
------解决方案--------------------
第一步依赖关系就弄不出了。。。。汗。。。好难一个

关于百万域名树，求思路,该如何解决

相关推荐