SQL金典

ps:补充自己的基础知识，大神请无视..

~~~~~~~~~~~~~~~~~~~~~

DataBase Management System,DBMS。。。。
Catalog 。。。库
Table。。。。表
Column。。。列--Field 字段，每个列描述数据的一个特性。
DataType 。。。数据类型
Record。。。。记录---Row行，
PrimaryKey。。。主键-----多个字段才唯一标识一列时，称为复合主键
Index 。。。索引-不建立索引是全表扫描，速度慢；建立索引只扫描索引，速度快；
    缺点：占据一定磁盘空间，减慢了插入和删除速度（更新索引）；
表关联：两张表通过字段关联，关联到其他表的主键的字段称为 外键；
SQL的4个功能：创建库并定义表结构，查询数据，更新、删除指定数据，控制数据库安全。

1、入门

1、数据类型整型、数值类型、字符相关类型（固定长度char、可变长度varchar、多语言可变长度nvarchar、可变长度字符串text、ntext可变大字符）、日期时间类型datetime/smalldatetime/timestamp时间戳、二进制类型：图片、视频等，非常大的，没有固定结构的数据，设置和读取也需要宿主语言的辅助。如 image（MS sqlServer），其他是blob。 2、通过SQL 管理数据表创建表 create table name{ 字段名1 字段类型, 字段名2 字段类型, ..... 约束定义1, 约束定义2， ..... } 定义非空约束，在类型定义后增加 NOT NULL ，定义默认值，------------增加 DEFAULT ，定义主键，在所有字段定义之后， PRIMARY KEY(字段名)，联合主键：两个字段联合起来作为主键，（复合主键），PRIMARY KEY（字段名1，字段名2），缺点：效率低，增删改查都需要处理两个字段，大大降低了数据处理速度，结构糟糕，联合主键会有业务含义，与“使用逻辑主键不是业务主键”的最佳实践冲突，开发和维护麻烦，外键麻烦或无法创建，开发难度很大，工具和框架对单主键支持良好，对多主键复杂特殊处理。定义外键：所有字段之后，FOREIGN KEY 外键字段名 REFERENCES 目标表名(被关联的字段名) 修改已有数据表： ALTER TABLE 待修改的表名 ADD 字段名字段类型 ALTER TABLE 待修改的表名 DROP 待删除的字段名删除数据表 DROP table 表名

insert into tableName(A,B,C) values(a,b,c) insert into tableName(a,b,c) 按照定义表中字段顺序进行插入，不推荐。非空值必须插入，主键必须唯一不重复，外键值必须在目标表中存在。--所以不推荐在数据库中生成外键，有程序控制更灵活。 update tableName set A=a,B=b,C=c where X=x 非空值不能更新为NULL,主键不能更新为重复，外键不能不存在。 delete from tableName where X=x 有外键时，必须先删除引用，不然删除失败。 delete只删除数据，drop 删除数据和表结构。

select * from tableName where X select A,B from tableName where X 列名 as 别名，as 可省略，但要保留空格。过滤问题：可程序控制，缺点是全取出对内存网络消耗都大，程序实现复杂，关联其他表的情况不能处理。所以用数据库提供的最好。数据汇总聚合函数 MAX MIN AVG SUM COUNT count(*)结果集的总条数，count(列名) 列名的值不为NULL的总记录数，不一定相等。 order by A asc/desc, B asc/desc 先A，再B 排序----推荐显式指定排序，防止不同数据库之间差异影响结果。通配符过滤： like 二元操作符，左边为列名，右边为表达式，单字符匹配下划线 _ ，如 b_d，匹配第一个字符为b，第二个字符任意，第三个字符为d的字符串。多字符匹配百分号 % ，如 like ‘%abc%’. 可一起使用，如 like '%n_' 集合匹配只MS SQL Server 支持，方括号[] ，与字符集中任意一字符想匹配的字符，如 [bt],有点像..正则表达式啊？还可以使用否定符取反，[^bt],匹配不是bt的串，在其他库上可用 or语句实现。缺点：效率低，不要过多使用。空值检测 select A,B,C from tableName where X is/is not NULL 反义运算符 ! 作用于运算符的取反，只有MS SQL 和DB2支持， NOT 作用于表达式的取反， NOT(表达式)，推荐使用。多值检测 or或 in， IN（值1，值2，值3....）范围值检测 < > 或 between and，字段名 between leftValue and rightValue ，包括范围边界值。性能好，优先考虑。低效的where 1=1 :数据库系统无法使用索引等查询优化策略，只能每行数据进行扫描(全表扫描)，大大降低了性能。数据分组：用来将数据分为多个逻辑组，每个组是所有记录的一个子集，从而对每组进行聚合运算。Group by 分组字段。一般放在语句最后。分组语句必须和聚合函数一起使用？又可以分开使用？需要分组的所有列，都必须位于group by子句列名列表中，没有出现的列，不能放在select语句后的列名列表中。 select A,B from tableName group by A ,是错误的，A分组了，但B没有，不一样的B但一样的A的无法显示。 select A,sum(B) from tableName group by A,正确，聚合函数得出一样的B值，就能显示。很多列时是逐层分组，组中组，结果集是以最末一级分组来进行输出的。列：select A,B,count(*) as M from tableName group by A,B order by A Having语句对部分分组的过滤，聚合函数不能用于where语句，改为having即可，having 可使用复杂的过滤条件，or、and in 等。语法和where几乎一样，只是和group by的位置不一样，where在group by 之前，having 在group by 之后， having语句不能包含未分组的列名，应该能同时用吧? 限制结果集行数只检索结果集中的部分行，主流数据库都支持，但差异很大。 MySQL 关键字 limit 放在select语句最后，limit 首行行号, 要返回结果集的最大数目 --行号从0开始例子： select * from tableName order by X desc limit 2,5 SQLServer2000 关键字TOP NUM 结果集中的前N条记录，用子查询实现区间范围功能，例：select top 3 * froom tableName where A NOT IN ( select top 5 A from tableName order by X desc) order by X desc --查询按X排序的第6开始的3条结果。 SQLserver2005 兼容2000，另外还有窗口函数 row_number()，计算每一行数据在结果集中的行号(从1开始)，语法：row_number() over(排序规则) --只出现在select或order by 子句中例：(select row_number() over(order by A) as rownum,A,B,C,D from tableName ) as M 配合子查询使用 select * from M where rownum >=3 and rownum<=5 Oracle 窗口函数 row_number()，与sqlserver2005一样，但是不用 as定义别名，另外：Oracle为每个结果集都默认增加行号的列rownum，所以前N条记录可以用 where rownum<=N 实现，但是取中间值必须用窗口函数，因为Oracle会把不符合的剔除结果集，后面的rownum会自动减一，一致都不满足。 DB2 窗口函数支持，还有关键字 Fetch,用来提取前N行，放在order by后面，例：select * from tableName order by X desc fetch first 6 rows only 可用fetch配合子查询实现区间。数据库分页核心就是限制结果集行数每页数据条数 PageSize，当前页(从0开始计数)CurrentIndex, 一次只查询从P*C开始的P条数据。抑制数据重复 distinct 关键字是对整个结果集进行数据重复抑制的，不是针对一列。计算字段：数据默认展现方式不完全符合应用要求时，经计算、转换、格式化等再使用，比用宿主语言处理性能高很多。常量字段值确定的一个值作为字段，可用as 。字段间计算，加减乘除等，可用于where子句，数据处理函数字符串长度，length,（在ms sql server中是len）字符串子串 substring(Oracle和DB2中是substr)，字符串连接 MYSQL会把+ 转化为数值，不能用，应该用函数 concat()，concat_ws()可加入指定分隔符。 MS SQL Server 用+， Oracle 使用|| 双竖线，也提供concat(), DB2 双竖线 || ，和concat()。计算字段的其他用途：数据过滤、删除、更新中，都可以使用计算字段。不从实体表中取的数据： MYSQL和MS SQL Server 允许使用不带FROM子句的select语句来查询不属于任何实体表的数据，例： select 1 /select length('abc') Oracle不允许，但可以使用系统表来作为from子句，常用DUAL。例： select 1,length('abc') from DUAL DB2 的系统表是 SYSIBM.SYSDUMMY1 联合结果集： UNION 两个完全不同的查询结果集的组合，显示在一个结果集中。相当于select 语句+起来，一般用于各种报表。 select A,B,C from table1 Union select X,Y,Z from table2 原则：结果集的列数相同，不同时补常量字段；对应列的类型相容，相同或者能转换为同一类型--推荐类型完全相同。 Union 会把完全重复的数据合并为一条，（自带distinct啊...），不需要合并的使用Union all.

数学函数绝对值 ABS()，指数power()，平方根sqrt()，随机数 select rand()--Mysql, select rand(随机数种子) --MS SQL server， select dbms_random.value from dual --Oracle没有内置随机数函数还有 dbms_random.value(low,high) ，dbms_random.normal正态分布的一组数，偏差1，期望为0 dbms_random.string(opt,len)随机字符串。 select SYSFUN.rand() from sysibm.sysdummy1 --DB2. Round()四舍五入圆周率π， PI()，Oracle等不支持的用 ACOS(-1)代替:-1的反余弦值等于π值。求符号：SIGN(),大于0，则1，小于0，则-1，等于0，则0. 求整除余数:MOD()，--MS SQLserver中为操作符%. 自然对数： LOG() --Oracle中为 LN(). LOG10() 计算一个以10为底的对数值 --Oracle中为LOG(m,n)，以m为底n的对数。 Power(X,Y)用来计算X的Y次幂。字符串函数：长度：length(),----或len()，小写：lower(),---DB2中为 Lcase(). 大写：Upper(),---DB2中为Ucase(). 截去左侧空格：LTRIM()，右侧空格：RTRIM()，两侧空格：TRIM()或者组合左右实现。子串：substring(S,start,length)，substr(). 计算子串位置：Instr(string,substring),不在返回0，---MS SQL server中为charindex，---DB2中为locate(subs,S). 从左侧取子串：left(s,length),从右侧取子串：right()，字符串替换：Replace(S,tobeS,toS),toS是空的话就是删除功能。得到字符的ASCⅡ码：ASCⅡ(), 反过来是 CHAR(),--Oracle中为CHR()，发音匹配：soundex()计算发音特征值，返回4个字节的字符串，第一个字符总是初始字符串的第一字符，后面是3位数字。 difference()--MS sql server和DB2中额外提供的函数。日期时间函数: 类型有4种日期Date、时间Time、日期时间DateTime、时间戳TimeStamp。一般字符串可自动转化为对应类型，但Oracle需要函数To_Date()，当前日期时间 MySQL NOW()， ---等同于 SYSDATE()、CURRENT_TIMESTAMP, CURDATE()日期， CURRENT_DATE. CURTIME()时间， MS SQL SERVER getdate(),配合convert()使用。 select convert(varchar(50),getdate(),101) as 当前日期， select convert(varchar(50),getdate(),108) as 当前时间， Oracle 使用系统表 DUAL中查询SYSTIMESTAMP来得到当前时间戳，SYSDATE得到日期时间，配合TO_CHAR(时间日期值，'YYYY-MM-DD'),TO_CHAR(时间日期值，'HH24:MI:SS')。 DB2 系统表SYSIBM.SYSDUMMY1中的 CURRENT TIMESTAMP/DATE/TIME。日期增减 MS SQL Server 中 DATEADD(datepart,number,date) 日期差额 MS SQL Server 中 DATEDIFF(datepart,startdate,enddate)返回以datepart为单位的差额例：select DATEDIFF(S,convert(varchar(50),getdate(),101),getdate())--今天过了多少秒。计算日期是星期几： MYSQL dayNAME() MS SQL server : select datename(dw,getdate()), --dw 工作日， Oracle： TO_CHAR(DATE,format)--day 会返回周几取得日期特定部分： MS SQL中 DATENAME() 和DATEPART()，其他函数：类型转换，尽量显式转换，避免隐式转换。 MYSQL 中 CAST(expression as type)和Convert(ex,type)， MS SQL server，CAST(expression as type)和Convert(type，ex)。空值处理： coalesce(表达式,value1,value2...),返回所有参数中第一个非空表达式， coalesce()的简化版，两个参数 IFNULL(EX,value)--MYSQL ISNULL(ex,value)--MS SQL Server NVL(ex,value)--Oracle NULLIF(ex1,ex2) 如果表达式不等价，返回ex1的值，如等价，返回ex1类型的空值。 CASE函数：用法1， case expression when value1 then returnvalue1 when value2 then returnvalue2 else defaultreturnvalue end 用法2，case when condition1 then returnvalue1 when... else defaultreturnvalue end --只能对一个表达式进行判断。各数据库系统独有函数： MS SQL server ，辅助函数 app_name()返回当前回话的应用程序名称； current_user 当前登录用户名 host_name()返回工作站名。 newid()生成全局唯一字符串，

1、索引针对字段,必须指定字段,可以为多字段创建一个索引, 创建表 create table t_person( fnumber varchar(20), fname varchar(20), fage int) 创建索引 create index 索引名 on 表名(字段1,字段2,...) create index idx_person_name on t_person(fname) 删除索引用 drop index 表名.索引名 2、约束非空 NOT NULL、唯一 Unique约束防止一个特定列中两个记录具有同样的值，分为单字段唯一与复合唯一单字段唯一的语句是字段后加 UNIQUE，--该字段不能有重复值复合唯一是 constraint 约束名 unique(字段1,字段2...)--字段1和字段2，单个可以重复，但是不能同时重复。在已经创建好的表上添加新约束 alter table 表名 add constraint 约束名 unique(字段1,..) 删除约束 alter table 表名 drop constraint 约束名 CHECK约束检查输入到记录中的值是否满足一个条件，任意有效的SQL表达式，例： age int check(age>0), number varchar(20) check (length(number)>12) 如CHECK子句要使用其他列，则在create table末尾使用 constraint关键字定义。 constraint 约束名 check(条件)，例：create table t1(A INT, B INT,C INT, Cconstraint ck_AB Check(A<B)) 主键约束唯一标识，不空，PRIMARY KEY，外键: 语法，foreign key 外键字段 references 外键表名(外键表的主键字段) 或 alter table tName add constraint fk_A_B foreign key (外键字段) references 外键表名(外键表的主键字段)

join类型：交叉连接(cross join)、内链接(inner join)、外连接(outter join)，部分数据库系统还支持联合连接(union join)。 1、内连接：语法 inner join tableName on condition --进行连接时的条件，例：select A,B from table1 inner join table2 on table1.M=table2.N where table1.X=x inner 是可选的，默认就是内连接。 2、不等值连接：连接的条件中可以使用< > <> 等运算符，以及like between and，和函数。不等值连接是 2个表的笛卡尔运算，一般需配合等值连接匹配条件使用。 3、交叉连接：所有表所有记录包含在结果集中，不存在on子句，分隐式和显式连接。隐式： select t1.A,t2.B from t1,t2 显示： select t1.A,t2.B from t1 cross join t2。一般只用隐式连接。 4、自连接：表与自身连接，通常需处理的问题是一个记录和自己相同，或者A与B相同时B也与A相同的问题。会写成 o1.id<o2.id. 5、外部连接：主要用来解决空值匹配的问题，不需要两个表具有匹配记录，这样可以指定某个表中的记录总是放到结果集中。分为3种类型：右外 right outer join，左外left outer join，全外full outer join。左外返回左表中部复合连接条件的数据，右外返回右表中，全外是两个合集。--以关键字join分左右。

以结果集供其他SQL语句使用，--嵌套内的查询。只返回单值的，和返回一个数据集的. 1、单值的又叫标量子查询，可用于列表、表达式、where等场合 2、列值子查询，表子查询，可用于from、insert、连接、IN子句等场合。 select id,name,(select max(X) from B where B.id=A.id) from A --通过where子句，子查询连接到外部的select，不能单独执行。--相关子查询。 3、集合运算符与子查询 in 匹配某一项， =any 等价于in， <>any 等价于 NOT IN， any不能与固定的集合想匹配， All 也需要带比较符，比较的值需要匹配子查询中所有值，不能与固定集合想匹配。如匹配集合为空，不论什么比较，ALL都返回true。 exists 单目运算符，检查每一行是否匹配子查询，只有和相关子查询一起使用。 select A,B from t1 where exists ( select * from t2 where t2.id=t1.id and t2.X<x) 4、子查询应用 insert into t1(A,B) select A,B from t2 --列序对应。 A或者B换成 case 子句，可实现数据处理，

1、SQL注入漏洞攻防：用户在输入中拼接字符串，偶后转入数据库去执行这字符串，造成不可预测影响。过滤敏感字符和使用参数化SQL；过滤 or/and/select/delete等关键字，--麻烦且不严谨。 2、SQL调优：二八原则：找出消耗性能的语句，优化。索引：最根本的优化方法，内功！聚簇索引：数据表的物理顺序与索引顺序相同；字典里拼音和偏旁部首都是索引，前一是聚簇的，存储碎片-重建索引，reindex/rebuild ，尽量减少全表扫描，创建必要索引，使用预编译查询(参数化SQL)、调整where子句连接顺序-DBMS一般采用自下而上的顺序解析WHERE子句，表连接最好写在其他where条件之前，以过滤掉最大数量记录后再连接， select中不使用*，尽量压缩SQL到一条语句且一次执行。用where 替换 having--后者只会在检索出所有记录后才对结果集过滤，使用表别名，前缀每个列，减少解析时间和错误。用exists替代IN--in子句执行一个子查询内部的排序和合并，用表连接替换exists 避免在索引列上使用计算-- 使用UNION all 替换union--在确保结果不重时，不实用检索的自动去重功能。避免隐式类型转换造成全表扫描--查询条件中使用匹配的类型值，防止检索范围过宽--使用is not null 或不等于判断，可能造成优化器假设匹配记录数太多，或使用like的带 %c 形式，不能有效评估匹配数量。 3、事务：原子操作，transaction，原子性Atomicity、一致性Consistency、隔离性Isolation、持久性Durability，简称 ACID特性。启动、提交、回滚..制定锁粒度、隔离级别.. 例： set transaction isolation level read uncommited begin transaction .... commit 4、自动增长字段： MS SQLserver 中关键字为 identity(startvalue,step)起始数字，步长。业务主键后期维护不方便，逻辑主角不能合并表。 6、NULL的学问：NULL表示未知，而不是没有值，和任何运算都是NULL，出现在where子句是False，在聚合函数中会被忽略。 7、开窗函数：函数名(列） over(选项) -- select A,B,COUNT(*) OVER() from t1 where X<x partition by 子句，定义行的分区，从而进行聚合计算，创建的分区独立于结果集，位于over的选项内。可多次使用，结果互不影响。 select A,B,COUNT(*) OVER(partition by A),COUNT(*) OVER(partition by B) from t1. 8、with子句和子查询：降低使用子查询的次数可以优化性能， SQL提供了with子句用于为子查询定义一个别名，一次定义多次使用。 DRY don't repeat yourself. 格式： with 别名 as (子查询) --是SQL语句，不是存储过程，可远程调用。还可以定义列别名： with 别名(f1,f2) as (子查询) 9、表复制： create table t2 as select * from t1 where 1<>1 select * into t2 from t1 where 1<>1

相关推荐