在MySQL中,选择正确的数据类型,对于性能至关重要。一般应该遵循下面两步:(1)确定合适的大类型:数字、字符串、时间、二进制;(2)确定具体的类型:有无符号、取值范围、变长定长等。
在MySQL数据类型设置方面,尽量用更小的数据类型,因为它们通常有更好的性能,花费更少的硬件资源。并且,尽量把字段定义为
NOT NULL
,避免使用NULL
。1 数值类型
1.1 说明
类型 | 大小 | 范围(有符号) | 范围(无符号) | 用途 |
---|---|---|---|---|
TINYINT | 1 字节 | (-128, 127) | (0, 255) | 小整数值 |
SMALLINT | 2 字节 | (-32 768, 32 767) | (0, 65 535) | 大整数值 |
MEDIUMINT | 3 字节 | (-8 388 608, 8 388 607) | (0, 16 777 215) | 大整数值 |
INT或INTEGER | 4 字节 | (-2 147 483 648, 2 147 483 647) | (0, 4 294 967 295) | 大整数值 |
BIGINT | 8 字节 | (-9 233 372 036 854 775 808, 9 223 372 036 854 775 807) | (0, 18 446 744 073 709 551 615) | 极大整数值 |
FLOAT | 4 字节 | (-3.402 823 466 E+38, 1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) | 0, (1.175 494 351 E-38, 3.402 823 466 E+38) | 单精度 浮点数值 |
DOUBLE | 8 字节 | (1.797 693 134 862 315 7 E+308, 2.225 073 858 507 201 4 E-308), 0, (2.225 073 858 507 201 4 E-308, 1.797 693 134 862 315 7 E+308) | 0, (2.225 073 858 507 201 4 E-308, 1.797 693 134 862 315 7 E+308) | 双精度 浮点数值 |
DECIMAL | 对DECIMAL(M,D) ,如果M>D,为M+2否则为D+2 | 依赖于M和D的值 | 依赖于M和D的值 | 小数值 |
1.2 优化建议
- 如果整形数据没有负数,如ID号,建议指定为
UNSIGNED
无符号类型,容量可以扩大一倍。 - 建议使用
TINYINT
代替ENUM
、BITENUM
、SET
。 - 避免使用整数的显示宽度,也就是说,不要用
INT(10)
类似的方法指定字段显示宽度,直接用INT
。关于INT显示宽度。 - 用
INT UNSIGNED
来存储IPv4地址,用VARBINARY
来存储IPv6地址,当然存储之前需要用PHP函数转换。 DECIMAL
最适合保存准确度要求高,而且用于计算的数据,比如价格。但是在使用DECIMAL
类型的时候,注意长度设置。- 建议使用整形类型来运算和存储实数,方法是,实数乘以相应的倍数后再操作。
- 整数通常是最佳的数据类型,因为它速度快,并且能使用
AUTO_INCREMENT
。
2 日期和时间
2.1 说明
类型 | 大小 (字节) |
范围 | 格式 | 用途 |
---|---|---|---|---|
DATE | 3 | 1000-01-01 到 9999-12-31 | YYYY-MM-DD | 日期值 |
TIME | 3 | ‘-838:59:59’ 到 ‘838:59:59’ | HH:MM:SS | 时间值或持续时间 |
YEAR | 1 | 1901 到 2155 | YYYY | 年份值 |
DATETIME | 8 | 1000-01-01 00:00:00 到 9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值 |
TIMESTAMP | 8 | 1970-01-01 00:00:00 到 2037 年某时 | YYYYMMDDhhmmss | 混合日期和时间值,时间戳 |
2.2 优化建议
- MySQL能存储的最小时间粒度为秒。
- 建议用
DATE
数据类型来保存日期。MySQL中默认的日期格式是yyyy-mm-dd
。 - 用MySQL的内建类型
DATE
、TIME
、DATETIME
来存储时间,而不是使用字符串。 - 当数据格式为
TIMESTAMP
和DATETIME
时,可以用CURRENT_TIMESTAMP
作为默认(MySQL5.6以后),MySQL会自动返回记录插入的确切时间。 TIMESTAMP
是UTC时间戳,与时区相关。DATETIME
的存储格式是一个YYYYMMDD HH:MM:SS
的整数,与时区无关,你存了什么,读出来就是什么。- 除非有特殊需求,否则建议使用
TIMESTAMP
,它比DATETIME
更节约空间。 - 有时人们把Unix的时间戳保存为整数值,但是这通常没有任何好处,这种格式处理起来不太方便,我们并不推荐它。
3 字符串
3.1 说明
类型 | 大小 | 用途 |
---|---|---|
CHAR | 0-255字节 | 定长字符串 |
VARCHAR | 0-65535 字节 | 变长字符串 |
TINYBLOB | 0-255字节 | 不超过 255 个字符的二进制字符串 |
TINYTEXT | 0-255字节 | 短文本字符串 |
BLOB | 0-65 535字节 | 二进制形式的长文本数据 |
TEXT | 0-65 535字节 | 长文本数据 |
MEDIUMBLOB | 0-16 777 215字节 | 二进制形式的中等长度文本数据 |
MEDIUMTEXT | 0-16 777 215字节 | 中等长度文本数据 |
LONGBLOB | 0-4 294 967 295字节 | 二进制形式的极大文本数据 |
LONGTEXT | 0-4 294 967 295字节 | 极大文本数据 |
3.2 优化建议
- 字符串的长度相差较大用
VARCHAR
;字符串短,且所有值都接近一个长度用CHAR
。 CHAR
和VARCHAR
适用于包括人名、邮政编码、电话号码和不超过255个字符长度的任意字母数字组合。那些要用来计算的数字不要用VARCHAR
类型保存,因为可能会导致一些与计算相关的问题。换句话说,可能影响到计算的准确性和完整性。BINARY
和VARBINARY
存储的是二进制字符串,与字符集无关。BLOB
系列存储二进制字符串,与字符集无关。TEXT
系列存储非二进制字符串,与字符集相关。一般情况下,你可以认为BLOB
是一个更大的VARBINARY
;TEXT
是一个更大的VARCHAR
。BLOB
和TEXT
都不能有默认值。
4 INT显示宽度
我们经常会使用命令来创建数据表,而且同时会指定一个长度,如下。但是,这里的长度并非是TINYINT
类型存储的最大长度,而是显示的最大长度。
CREATE TABLE `user`( `id` TINYINT(2) UNSIGNED );
这里表示user表的id字段的类型是TINYINT
,可以存储的最大数值是255
。所以,
在存储数据时,如果存入值小于等于255
,如200
,虽然超过2位,但是没有超出TINYINT
类型长度,所以可以正常保存;如果存入值大于255
,如500
,那么MySQL会自动保存为TINYINT
类型的最大值255
。
在查询数据时,不管查询结果为何值,都按实际输出。这里TINYINT(2)
中2
的作用就是,当需要在查询结果前填充0
时,命令中加上ZEROFILL
就可以实现,如:
`id` TINYINT(2) UNSIGNED ZEROFILL
这样,查询结果如果是5
,那输出就是05
。如果指定TINYINT(5)
,那输出就是00005
,其实实际存储的值还是5
,而且存储的数据不会超过255
,只是MySQL输出数据时在前面填充了0
。
换句话说,在MySQL命令中,字段的类型长度TINYINT(2)
、INT(11)
不会影响数据的插入,只会在使用ZEROFILL
时有用,让查询结果前填充0
。
参考资料: