MySQL函数
单行函数
- 操作数据对象
- 接受参数返回一个结果
- 只对一行进行交换
- 每行返回一个结果
- 可以嵌套
- 参数可以是一列或者一个值
基本函数
| 函数 | 用法 |
|---|---|
| ABS(X) | 返回x的绝对值 |
| SIGN(X) | 返回x的符号.正数返回1,负数返回-1,0返回0 |
| PI() | 返回圆周率的值 |
| CEIL(X),CEILING(X) | 返回大于或者等于某个值的最小整数 |
| FLOOR(X) | 返回小于或者等于某个值的最大整数 |
| LEAST(e1,e2,e3…) | 返回列表中的最小值 |
| GREATEST(e1,e2,e3…) | 返回列表中的最大值 |
| MOD(x,y) | 返回x除以y后的余数 |
| RAND() | 返回0-1的随机数 |
| RAND(X) | 返回0-1的随机数,其中x的值用作种子值,相同的x值会产生相同的随机数 |
| ROUND(X) | 返回一个对x的值进行四舍五入后,最接近于x的整数 |
| ROUND(X,Y) | 返回一个对x的值进行四舍五入后最接近x的值,并保留到小数点后面y位 |
| TRUNCATE(X,Y) | 返回数字x截断为y位小数 |
| SQRT(X) | 返回x的平方根,当x的值为负数时,返回null |
进制转换函数
| 函数 | 用法 |
|---|---|
| BIN(X) | 返回x的二进制编码 |
| HEX(X) | 返回x的十六进制编码 |
| OCT(X) | 返回x的八进制编码 |
| CONV(X,F1,F2) | 返回f1进制数变成f2进制数 |
字符串函数
注意:mysql的索引都是从1开始的
| 函数 | 用法 |
|---|---|
| ASCII(s) | 返回字符串s中的第一个字符的ASCII码值 |
| CHAR_LENGTH(s) | 返回字符串s的字符数,作用于CHARACTER_LENGTH(s)相同 |
| LENGTH(s) | 返回字符串s的字节数,和字符集有关(一个汉字占三个字节) |
| CONCAT(s1,s2,s3….,sn) | 连接s1,s2,…,sn为一个字符串 |
| CONCAT_WS(x,s1,s2…,sn) | 同CONCAT(s1,s2…)函数,但是每个字符串之间要加上x |
| INSERT(str,idx,len,replacestr) | 将字符串str从第idx位置开始,len个字符长的子串替换为字符串replacestr |
| REPLACE(str,a,b) | 用字符串b替换字符串str中所有出现的字符串a |
| UPPER(s)或UCASE(s) | 将字符串s的所有字母转换成大写字母 |
| LOWER(s)或LCASE(s) | 将字符串s的所有字母转成成小写字母 |
| LEFT(str,n) | 返回字符串str最左边的n个字符 |
| RIGHT(str,n) | 返回字符串str最右边的n个字符 |
| LPAD(str,len,pad) | 用字符串pad对str最左边进行填充,直到str的长度为len个字符 |
| RPAD(str,len,pad) | 用字符串pad对str最右边进行填充,直到str的长度为len个字符 |
| LTRIM(s) | 去掉字符串s左侧的空格 |
| RTRIM(s) | 去掉字符串s右侧的空格 |
| TRIM(s) | 去掉字符串s开始与结尾的空格 |
| TRIM(s1 FROM s) | 去掉字符串s开始与结尾的s1 |
| TRIM(LEADING s1 FROM s) | 去掉字符串s开始处的s1 |
| TRIM(TRAILING s1 FROM s) | 去掉字符串s结尾处的s1 |
| REPEAT(str,n) | 返回str重复n次的结果 |
| SPACE(n) | 返回n个空格 |
| STRCMP(s1,s2) | 比较字符串s1,s2的ASCII码值的大小 |
| SUBSTR(s,index,ken) | 返回字符串s的index位置其len个字符,作用与SUBSTRING(s,n,len),MID(s,n,len)相同 |
| LOCATE(substr,str) | 返回字符串substr在字符串str中首次出现的位置,作用与POSITION(substr IN str),INSTR(str,substr)相同.未找到则返回0 |
| ELT(m,s1,s2…,sn) | 返回指定位置的字符串,如果m=1,则返回s1,如果m=2,则返回s2,如果m=n,则返回sn |
| FIELT(s,s1,s2…,sn) | 返回字符串s在字符串列表中第一次出现的位置 |
| FIND_IN_SET(s1,s2) | 返回字符串s1在字符串s2中出现的位置,其中,字符串s2是一个以逗号分隔的字符串 |
| REVERSE(s) | 返回s反转后的字符串 |
| NULLIF(value1,value2) | 比较两个字符串,如果value1和value2相等,则返回NULL,否则返回value1 |
日期和时间函数
获取日期、时间
| 函数 | 用法 |
|---|---|
| CURDATE(), CURRENT_DATE() | 返回当前日期,只包含年,月,日 |
| CURTIME(), CURRENT_TIME() | 返回当前时间,只包含时,分,秒 |
| NOW(), SYSDATE(), CURRENT_TIMESTAMP(), LOCALTIME(), LOCALTIMESTAMP() | 返回当前系统时间和日期 |
| UTC_DATE() | 返回UTC日期 |
| UTC_TIME() | 返回UTC时间 |
日期与时间戳的转换
| 函数 | 用法 |
|---|---|
| UNIX_TIMESTAMP() | 以UNIX时间戳的形式返回当前时间. |
| UNIX_TIMESTAMP(date) | 将时间date以UNIX时间戳的形式返回 |
| FROM_UNIXTIME(timestamp) | 将UNIX时间戳的时间转为普通格式的时间 |
获取月份,星期,星期数,天数等函数
| 函数 | 用法 |
|---|---|
| YEAR(date)/MONTH(date)/DAY(date) | 返回具体的日期值 |
| HOUR(time)/MINUTE(time)/SECOND(time) | 返回具体的时间值 |
| MONTHNAME(date) | 返回月份,January…. |
| DAYNAME(date) | 返回星期几,MONDAY,TUESDAY… |
| WEEKDAY(date) | 返回周几,注意,周一是0,周二是1…周日是6 |
| QUARTER(date) | 返回日期对应的季度,范围是1-4 |
| WEEK(date), WEEKOFYEAR(date) | 返回一年中的第几周 |
| DAYOFYEAR(date) | 返回日期是一年中的第几天 |
| DAYOFMONTH(date) | 返回日期位于所在月份的第几天 |
| DAYOFWEEK(date) | 返回周几,注意,周日是1,周一是2…周六是7 |
日期的操作函数
| 函数 | 用法 |
|---|---|
| EXTRACT(type FROM date) | 返回指定日期中特定的部分,type指定返回的值 |
type参数的取值和含义
| type取值 | 含义 |
|---|---|
| MICROSECOND | 返回毫秒值 |
| SECOND | 返回秒数 |
| MINUTE | 返回分钟数 |
| HOUR | 返回小时数 |
| DAY | 返回天数 |
| WEEK | 返回日期在一年中的第几个星期 |
| MONTH | 返回日期在一年中的第几个月 |
| QUARTER | 返回日期在一年中的第几个季度 |
| YEAR | 返回日期的年份 |
| SECOND_MICROSECOND | 返回秒和毫秒值 |
| MINUTE_MICROSECOND | 返回分钟和毫秒值 |
| MINUTE_SECOND | 返回分钟和秒值 |
| HOUR_MICROSECOND | 返回小时和毫秒值 |
| HOUR_SECOND | 返回小时和秒值 |
| HOUR_MINUTE | 返回小时和分钟值 |
| DAY_MICROSECOND | 返回天和毫秒值 |
| DAY_SECOND | 返回天和秒值 |
| DAY_MINUTE | 返回天和分钟值 |
| DAY_HOUR | 返回天和小时 |
| YEAR_MONTH | 返回年和月 |
时间和秒钟转换的函数
| 函数 | 用法 |
|---|---|
| TIME_TO_SEC(time) | 将time转化为秒并返回结果值.转化的公式为小时*3600+分钟*60+秒 |
| SEC_TO_TIME(seconds) | 将seconds描述转化为包括小时,分钟和秒的时间 |
计算日期和时间的函数
- 第一组
- 计算date与日期的时间相差值
| 函数 | 用法 |
|---|---|
| DATE_ADD(datetime, INTERVAL expr type),ADDDATE(date, INTERVAL expr type) | 返回与给定日期时间相差INTERVAL时间段的日期时间 |
| DATE_SUB(date, INTERVAL expr type),SUBDATE(date, INTERVAL expr type) | 返回与date相差INTERVAL时间间隔的日期 |
上述函数中type的取值
| type取值 | 含义 |
|---|---|
| HOUR | 小时 |
| MINUTE | 分钟 |
| SECOND | 秒 |
| YEAR | 年 |
| MONTH | 月 |
| DAY | 日 |
| YEAR_MONTH | 年和月 |
| DAY_HOUR | 日和小时 |
| DAY_MINUTE | 日和分钟 |
| DAY_SECOND | 日和秒 |
| HOUR_MINUTE | 小时和分钟 |
| HOUR_SECOND | 小时和秒 |
| MINUTE_SECOND | 分钟和秒 |
- 第二组
| 函数 | 用法 |
|---|---|
| ADDTIME(time1,time2) | 返回time1加上time2的时间,当time2为一个数字时,代表的是秒,可以为负数 |
| SUBTIME(time1,time2) | 返回time1减去time2后的时间,当time2为一个数字时,代表的是秒,可以为负数 |
| DATEDIFF(date1,date2) | 返回date1-date2的日期间隔天数 |
| TIMEDIFF(time1,time2) | 返回time1-time2的时间间隔 |
| FROM_DAYS(N) | 返回从0000年1月1日起,N天以后的日期 |
| TO_DAYS(date) | 返回日期date距离0000年1月1日的天数 |
| LAST_DAY(date) | 返回date所在月份的最后一天的日期 |
| MAKEDATE(year,n) | 针对给定年份与所在年份中的天数返回的一个日期 |
| MAKETIME(hour,minute,second) | 将给定的小时,分钟和秒组合成时间并返回 |
| PERIOD_ADD(time,n) | 返回time加上n后的时间 |
日期的格式化与解析
| 函数 | 用法 |
|---|---|
| DATE_FORMAT(date,fmt) | 按照字符串fmt格式化日期date值 |
| TIME_FORMAT(time,fmt) | 按照字符串fmt格式化时间time值 |
| GET_FORMAT(date_type,format_type) | 返回日期字符串的显示格式 |
| STR_TO_DATE(str,fmt) | 按照字符串fmt对str进行解析,解析为一个日期 |
上述函数中fmt参数格式和说明
| fmt格式符 | 说明 | fmt格式符 | 说明 |
|---|---|---|---|
| %Y | 4位数字表示年份 | %y | 2位数字表示年份 |
| %M | 月名表示月份(January,…) | %m | 2位数字表示月份(01,02…,12) |
| %b | 缩写的月名(Jan,Feb…) | %c | 数字表示月份(1,2,3….) |
| %D | 英文后缀表示月中的天数(1st,2nd,3rd…) | %d | 2位数字表示月中的天数(01,02…) |
| %e | 数字形式表示月中的天数(1,2,3,4,5…) | ||
| %H | 2位数字表示小数,24小时制(01,02…) | %h和%I | 2位数字表示小时,12小时制(01,02…) |
| %k | 数字形式的小时,24小时制(1,2,3…) | %l | 数字形式表示小时,12小时制(1,2,3…) |
| %i | 2位数字表示分钟(00,01,02…) | %S和%s | 2位数字表示秒(00,01,02…) |
| %W | 一周中的星期名称(Sunday,…) | %a | 一周中的星期缩写(Sun,Mon,Tues…) |
| %w | 以数字表示周中的天数(0=Sunday,1=Monday…) | ||
| %j | 以3位数字表示年中的天数(001,002…) | %U | 以数字表示年中的第几周,(1,2,3…)其中Sunday为周中第一天 |
| %u | 以数字表示年中的第几周(1,2,3…)其中Monday为周中第一天 | ||
| %T | 24小时制 | %r | 12小时制 |
| %p | AM或PM | %% | 表示% |
GET_FORMAT函数中date_type和format_type参数取值如下
| 日期类型 | 格式化类型 | 返回的格式化字符串 |
|---|---|---|
| DATE | USA | %m.%d.%Y |
| DATE | JIS | %Y-%m-%d |
| DATE | ISO | %Y-%m-%d |
| DATE | EUR | %d.%m.%Y |
| DATE | INTERVAL | %Y%m%d |
| TIME | USA | %h:%i:%s %P |
| TIME | JIS | %H:%i:%s |
| TIME | ISO | %H:%i:%s |
| TIME | EUR | %H:%i:%s |
| TIME | INTERVAL | %H%i%s |
| DATETIME | USA | %Y-%m-%d %H.%i.%s |
| DATETIME | JIS | %Y-%m-%d %H.%i.%s |
| DATETIME | ISO | %Y-%m-%d %H.%i.%s |
| DATETIME | EUR | %Y-%m-%d %H.%i.%s |
| DATETIME | INTERVAL | %Y%m%d %H%i%s |
流程控制函数
流程处理函数可以根据不同的条件,执行不同的处理流程,可以实现不同的条件选择
| 函数 | 用法 |
|---|---|
| IF(value,value1,value2) | 如果value的值为TRUE,返回value1,否则返回value2 |
| IFNULL(value1,value2) | 如果value1不为NULL,返回value1,否则返回value2 |
| CASE WHEN 条件1 THEN 结果1 WHEN 条件2 THEN 结果2 … [ELSE resultn] END | 相当于Java中的 if..else if … else… |
| CASE expr WHEN 常量值1 THEN 值1 WHEN 常量值1 THEN 值1 … [ELSE 值n] END | 相当于Java的switch…case… |
MYSQL信息函数
| 函数 | 用法 |
|---|---|
| VERSION() | 返回当前mysql数据库版本 |
| CONNECTION_ID() | 返回当前mysql服务器连接数 |
| DATABASE(),SCHEMA() | 返回mysql命令行当前所在数据库 |
| USER(),CURRENT_USER(),SYSTEM_USER(),SESSION_USER() | 返回当前mysql连接用户名,格式为”主机名@用户名” |
| CHARSET(value) | 返回字符串value的字符集 |
| COLLATION(value) | 返回字符串value的比较规则 |
其他函数
| 函数 | 用法 |
|---|---|
| FORMAT(value,n) | 返回对数字value进行格式化后的结果数据,n表示四舍五入后保留小数点后n位 |
| CONV(value,from,to) | 将value值进行不同进制转换 |
| INET_ATON(ipvalue) | 将以点分隔的ip地址转化为一个数字 |
| INET_NTOA(value) | 将数字形式的ip转化为以点分隔的地址 |
| BENCHMARK(n,expr) | 将表达式expr重复n边.用于测试mysql处理expr表达式所消耗的时间 |
| CONVERT(value USING char_code) | 将value的字符编码修改为char_code |
聚合函数
- 什么是聚合函数
- 聚合函数作用于一组数据,并对一组数据返回一个值
聚合函数类型
AVG()
SUM()
MAX()
MIN()
COUNT()
聚合函数不能嵌套调用
比如
AVG(SUM())这样调用
- 问题:用count(*),count(1),count(列名)谁好呢?
其实,对于
MyISAM引擎的表是没有区别的.这种引擎内部有一个计数器在维护着行数
Innodb引擎的表用COUNT(*),COUNT(1)直接读行数,复杂度是O(n),因为Innodb真的要去读一遍,但好于具体的COUNT(列名)
- 问题:能不能使用count(列名)替换count(*)?
不能使用
COUNT(列名)来代替COUNT(*),COUNT(*)是SQL92定义的标准统计行数的语法,跟数据库无关,跟NULL和非NULL无关说明:
COUNT(*)会统计值为NULL的行,而COUNT(列名)不会统计此列为NULL值的行
GROUP BY
基本使用
可以使用
group by将结果分为若干组
1 | SELECT column, group_function(column) |
注意:
WHERE一定要放在FROM后面
在SELECT列表中所有未包含在组函数中的列都应该包含在 GROUP BY子句中
包含在 GROUP BY 子句中的列不必包含在SELECT 列表中
使用多个列分组
1 | SELECT department_id dept_id, job_id, SUM(salary) |
GROUP BY中使用WITH ROLLUP
使用
WITH ROLLUP关键字之后,在所有查询出的分组记录之后增加一条记录,该记录计算查询出的所有记录的总和,即统计记录数量。
1 | SELECT department_id,AVG(salary) |
注意: 当使用
ROLLUP时,不能同时使用ORDER BY子句进行结果排序,即ROLLUP和ORDER BY是互相排斥的
HAVING
基本使用
过滤分组: HAVING子句
- 行已经被分组
- 使用了聚合函数
- 满足HAVING子句中条件的分组将被显示
- HAVING不能单独使用,必须跟GROUP BY一起使用
1 | SELECT department_id, MAX(salary) |
WHERE和HAVING的对比
- WHERE 可以直接使用表中的字段作为筛选条件,但不能使用分组中的计算函数作为筛选条件;HAVING必须要与GROUP BY 配合使用,可以把分组计算的函数和分组字段作为筛选条件
这就决定了,在需要对数据进行分组统计的时候,HAVING可以完成WHERE不能完成的任务.这是因为,在查询语法结构中,WHERE 在 GROUP BY 之前,所以无法对分组结果进行筛选,HAVING 在GROUP BY之后,可以使用分组字段和分组中的计算函数,对分组的结果集进行筛选,这个功能是WHERE无法完成的.另外,WHERE排除的记录不再包括在分组中.
- 如果需要通过连接从关联表中获取需要的数据,WHERE是先筛选后连接,而HAVING是先连接后筛选
这一点,就决定了在关联查询中,WHERE 比HAVING更高效.因为WHERE可以先筛选,用一个筛选后的较小数据集和关联表进行连接,这样占用的资源比较少,执行效率也比较高.HAVING则需要先把结果集准备好,也就是用未被筛选的数据集进行关联,然后对这个大的数据集进行筛选,这样占用的资源就比较多,执行效率也比较低.
总结
| 优点 | 缺点 | |
|---|---|---|
| WHERE | 先筛选数据再关联,执行效率高 | 不能使用分组中的计算函数进行筛选 |
| HAVING | 可以使用分组中的计算函数 | 在最后的结果集中进行筛选,执行效率低 |
SELECT的执行过程
查询结构
1 | -- 方式1: |
SELECT执行顺序
关键字的顺序不能颠倒
1
SELECT ... FROM ... WHERE ... GROUP BY ... HAVING ... ORDER BY ... LIMIT ...
SELECT 语句的执行顺序(在 MySQL 和 Oracle 中,SELECT 执行顺序基本相同)
1
FROM ... WHERE ... GROUP BY ... HAVING ... SELECT 的字段 ... DISTINCT ... ORDER BY ... LIMIT ...
1
2
3
4
5
6
7
8
9
101 FROM <left_table>
2 ON <join_condition>
3 <join_type> JOIN <right_table>
4 WHERE <where_condition>
5 GROUP BY <group_by_list>
6 HAVING <having_condition>
7 SELECT
8 DISTINCT <select_list>
9 ORDER BY <order_by_condition>
10 LIMIT <limit_number>比如,这个sql执行的顺序
1
2
3
4
5
6
7SELECT DISTINCT player_id, player_name, count(*) as num -- 顺序 5
FROM player JOIN team ON player.team_id = team.team_id -- 顺序 1
WHERE height > 1.80 -- 顺序 2
GROUP BY player.team_id -- 顺序 3
HAVING num > 2 -- 顺序 4
ORDER BY num DESC -- 顺序 6
LIMIT 2 -- 顺序 7在 SELECT 语句执行这些步骤的时候,每个步骤都会产生一个 虚拟表 ,然后将这个虚拟表传入下一个步
骤中作为输入。需要注意的是,这些步骤隐含在 SQL 的执行过程中,对于我们来说是不可见的。
SQL 的执行原理
SELECT 是先执行 FROM 这一步的。在这个阶段,如果是多张表联查,还会经历下面的几个步骤:
首先先通过
CROSS JOIN求笛卡尔积,相当于得到虚拟表vt(virtual table)1-1;通过
ON进行筛选,在虚拟表vt1-1的基础上进行筛选,得到虚拟表vt1-2;添加外部行。如果我们使用的是左连接、右链接或者全连接,就会涉及到外部行,也就是在虚拟表
vt1-2的基础上增加外部行,得到虚拟表vt1-3。
当然如果我们操作的是两张以上的表,还会重复上面的步骤,直到所有表都被处理完为止。这个过程得到是我们的原始数据。
当我们拿到了查询数据表的原始数据,也就是最终的虚拟表 vt1 ,就可以在此基础上再进行 WHERE 阶 段 。在这个阶段中,会根据 vt1 表的结果进行筛选过滤,得到虚拟表 vt2 。
然后进入第三步和第四步,也就是 GROUP BY 和 HAVING 阶段 。在这个阶段中,实际上是在虚拟表 vt2 的 基础上进行分组和分组过滤,得到中间的虚拟表 vt3 和vt4。
当我们完成了条件筛选部分之后,就可以筛选表中提取的字段,也就是进入到 SELECT 和 DISTINCT 阶段 。
首先在 SELECT 阶段会提取想要的字段,然后在 DISTINCT 阶段过滤掉重复的行,分别得到中间的虚拟表 vt5-1 和 vt5-2 。
当我们提取了想要的字段数据之后,就可以按照指定的字段进行排序,也就是ORDER BY 阶段 ,得到虚拟表 vt6 。
最后在vt6的基础上,取出指定行的记录,也就是 LIMIT 阶段 ,得到最终的结果,对应的是虚拟表 vt7 。
当然我们在写 SELECT 语句的时候,不一定存在所有的关键字,相应的阶段就会省略。
同时因为 SQL 是一门类似英语的结构化查询语言,所以我们在写 SELECT 语句的时候,还要注意相应的 关键字顺序,所谓底层运行的原理,就是我们刚才讲到的执行顺序。