mysql使用的坑

一:

mysql默认是安装记录的物理顺序取数据的,如果不加order by 排序,可能得不到预期的结果。

(1) 获取 两个时间点的 id  (很快)

$sql = ‘select id from apply_info where create_time< {$now} limit 1’;   (要加  order by id desc)

获得 idNow

$sql = ‘select id from apply_info where create_time>= {$yesterday} limit 1’ (要加 order by id asc)

获得 idYt

(2) 每次取 1000

do{

       select user_mobile,user_from from apply_info where  id <= {$idNow} limit 1000;

       idNow -= 1000;

       //toDo

} while (idNow >= idYt)

 二:

当使用limit时,explain可能会造成误导

(1)explain估计行数,不考虑limit,可能会对查询估计过多的检查行数

(2)类似于SELECT ... FROM TBL LIMIT N这样的查询因为用不到索引将要报告为慢查询,(如果N不大,实际很快)

配置文件设置min-examined-row-limit=Num of Rows,检查的行数>=这个量的查询才会被报告为慢查询,避免误判

(3)类似于这样的select .. from tb where key_part1= ? order by key_part2 limit n,explain也要估计出过多的检查行数

领导发的

先说我认为好的方法,很希望有觉得不合理的地方直接发QQ群讨论

1、    获取ID范围

获取minId: select id from apply_info where create_time>= {$yesterday} order by create_time,id limit 1

获取maxId: select id from apply_info where create_time< {$today} order by create_time desc,id desc  limit 1

2、          循环获取

while(1)

{

       $sql = “select id,user_mobile,user_from from apply_info where  id >= $minId and id<=$maxId order by id limit 1000”;

       $ret = 执行sql

       foreach($ret as $row)//处理

{

}

       $minId = $row[‘id’];

       If(count($ret) < 1000) break;

}

几个容易有问题的地方:

1、          王璐的获取id的方法,其实会扫描大块索引数据块,改进的方法其实是利用了create_time和id是一致的隐含信息

2、          有同学用获取最大和最小id的时候,用的是= 号,但是该秒如果没有数据就会有问题了

3、          limit m,n会导致扫描m+n行的记录,这块的问题大部分同学都发现了

4、          根据create_time的索引每次获取1000行不好嘛?这里涉及到从索引获取到ID后还需要到数据部分去获取其他字段,需要更多的IO,这个和INNODB的聚簇索引结构相关。