mysql使用的坑

一：

mysql默认是安装记录的物理顺序取数据的，如果不加order by 排序，可能得不到预期的结果。

(1) 获取两个时间点的 id （很快）

$sql = ‘select id from apply_info where create_time< {$now} limit 1’; （要加 order by id desc）

获得 idNow

$sql = ‘select id from apply_info where create_time>= {$yesterday} limit 1’ (要加 order by id asc)

获得 idYt

(2) 每次取 1000

do{

select user_mobile,user_from from apply_info where id <= {$idNow} limit 1000;

idNow -= 1000;

//toDo

} while (idNow >= idYt)

二：

当使用limit时，explain可能会造成误导

（1）explain估计行数，不考虑limit，可能会对查询估计过多的检查行数

（2）类似于SELECT ... FROM TBL LIMIT N这样的查询因为用不到索引将要报告为慢查询，（如果N不大，实际很快）

配置文件设置min-examined-row-limit=Num of Rows，检查的行数>=这个量的查询才会被报告为慢查询，避免误判

（3）类似于这样的select .. from tb where key_part1= ? order by key_part2 limit n，explain也要估计出过多的检查行数

领导发的

先说我认为好的方法，很希望有觉得不合理的地方直接发QQ群讨论

1、获取ID范围

获取minId: select id from apply_info where create_time>= {$yesterday} order by create_time,id limit 1

获取maxId: select id from apply_info where create_time< {$today} order by create_time desc,id desc limit 1

2、循环获取

while(1)

{

$sql = “select id,user_mobile,user_from from apply_info where id >= $minId and id<=$maxId order by id limit 1000”;

$ret = 执行sql

foreach($ret as $row)//处理

{

}

$minId = $row[‘id’];

If(count($ret) < 1000) break;

}

几个容易有问题的地方：

1、王璐的获取id的方法，其实会扫描大块索引数据块，改进的方法其实是利用了create_time和id是一致的隐含信息

2、有同学用获取最大和最小id的时候，用的是= 号，但是该秒如果没有数据就会有问题了

3、 limit m,n会导致扫描m+n行的记录，这块的问题大部分同学都发现了

4、根据create_time的索引每次获取1000行不好嘛？这里涉及到从索引获取到ID后还需要到数据部分去获取其他字段，需要更多的IO，这个和INNODB的聚簇索引结构相关。