铁路的售票系统回说明分库分表对架构的影响

铁路的售票系统来说明分库分表对架构的影响

一、问题：铁路的售票系统的数据量是海量吗？

不是。因为数据量不大，真不大。

每一个车次与车次间是独立的，每车次不超过2000张票，一天发车不超过50万车次；
以预售期15天来讲，15*0.1亿张不超过1.5亿笔的热线数据，称不上海量数据的。
再加上可以按线路分库，更是不到千万级的单表容量。已经发车完成的进入归档分析。
即数据库按路线使用不同的服务器，不同的车次放在不同的表中。并发量锁真不大。

当然，如果不分库分表，再加上不归档处理，铁路的售票系统的数据量看起来是海量的；
关键是这海量的数据没有意义。

二、如何分库分表？

2.1 分库，考虑数据间没有直接关系和服务器如何部署

铁路的售票系统为例来说，按路线分库，再按车次分表是合理的。
设路线有1万条，按每1000条需要两台服务器(一台热机沉余)，不到20台服务器
如果使用SAN存储，则使用SAN作为存储，本机作为热机沉余，只需要10台。
当然使用mySQL这种经济型数据库，服务器需要更多来防灾；
即可以采用双写或多写的方式来保证数据的绝对安全。

2.2分表，考虑数据间不存在重叠，即数据满足二分原则

铁路的售票系统的任意两个车次是没有关系的，所以可以分表。
电信的某个用户的通话和其它用户的通话记录，也是没有关系，所以可以分表处理
（实际上电信的系统，分库分表后也是不大的，难在后台的计费、结算等规则）

三、数据库访问接口

1. 元数据：如何识别到当前要处理的数量在哪张表？

铁路的售票系统会有一个车次管理系统，例2012年2月12日 D3206 车次，
按预先设计的在哪台服务器的哪个库，建哪个表。

2.建立元数据的规则：即具体如何分库分表的规则

这个就是数据库的访问接口。

3.数据库访问接口的透明程度

即哪个层知道哪些元数据信息。
例，是否让窗口售票的客户端来解析元数据的规则然后缓存，还是通过中间件来解析缓存的

具体各层使用怎样透明程度，和业务性质、节点和数据中心的拓扑等有关。

四、历史数据归档与分析

1.使用分库分表后，数据需要归档，分析处理的程序变得复杂，但使联机交易变得简单
2.分析：要注意是针对热线数据分析、归档数据分析、混合分析有关，
通过分库分表和归档，更方便使用分布式的统计方案。

具体可以参考，淘宝的开放平台架构师写的文章：

结论：分库分表跟不分库分表，整个架构是完全不一样的。

像铁票的售票系统、淘宝、电信、银行等，绝对要采用分库分表的数据存储方案，

来解决数据量的增长而不影响性能的问题。

像淘宝等互联网应用还要解决带宽即CDN问题。

1 楼 longhua828 2012-01-16

牛，顶一个

2 楼 memphis 2012-01-16

牛个屁，就凭你简单的算算就下结论就可以知道博主的无知与无畏

3 楼 yanwei11911011 2012-01-16

我总感觉火车票系统分表的意义不太大呢。
每一个车次与车次间是独立的，其实他是不独立的把
比如说T1车次与T2车次，你分别放到2个数据库中，如果只按照车次查询，可以达到你预想的效果，如果按照出发站，与到站查询的话，就要分别查询这2个库，发起2个语句，所以说，分库表的意义就没了

4 楼 amssy_zhu 2012-01-17

这么大的访问量，不分库分表，我认为系统是很难支撑，但分表分库后业务逻辑处理是会变的复杂。

5 楼 liujunsong 2012-01-17

分析思路是可以的,但是这个思路没有考虑实际的场景.

实际场景是指啥呢,在系统开发上面,数据库如何设计,一般都是规定好的,尤其在企业应用里面,真正合格的DBA绝对是稀缺资源.

如果采用分库分表的方案的话,开发会简化一些,在性能上容易控制;可是这样就增加了系统运维,尤其是数据库管理的难度;因此在一般情况下,负责数据库的人员会本能的给予反对和抵触,要求采用统一的库和表来存储.

如果由于数据集中带来性能问题,可以推到基础平台上来升级解决;这个问题不是开发和数据库人员的责任;但如果由于分库分表造成程序错误,大家都带来麻烦.

所以一般情况下,考虑到系统各个部分的协商,最后只有集中方式是容易获得通过的,而一旦形成事实,没有人会轻易去改变它.

架构师不是万能的,很多时候也只能接受现实,在现实基础上小修小补而已.

6 楼 lic_war3 2012-01-17

我觉得你有点想当然了，没有考虑现有的基础架构以及其相关业务规则。现有的数据库不一定是你想变就变的，重构需要考虑对整个体系的影响。而你的视角仅仅放在当前的网络售票系统。单就电话，窗口，网售的协作机制都未详细了解就妄下结论是不恰当的。

7 楼 Mybeautiful 2012-01-18

如果只是分表就能解决的问题，博主又极大的藐视了下铁路的售票系统的设计人员。

不是个具体分表不分表的实现问题，是个整体方案的设计的问题。

铁路的售票系统回说明分库分表对架构的影响

相关推荐