修改MySQL字符编码

修改编码其实是为了支持中文~

1. 编译级别。由于缺乏大量自己去编译MySQL的经验,所以对具体的编译优化不太熟悉,可参考简朝阳的《MySQL性能调优与架构设计》。以下内容来自《MySQL 5.1参考手册》2.8.2. 典型配置选项:

  • 默认地,MySQL使用latin1(cp1252)字符集。为了改变 默认设置,使用--with-charset选项:
  • shell> ./configure -- with-charset=CHARSET

警告: 如果你在创建了任何数据库表之后改变字符集,你将必须对每个表运行myisamchk -r -q --set-character-set= charset ,否则索引可能不正确地排序。

2. 启动参数。启动参数可以直接加在启动服务的命令后面,也可以加在配置文件中。如:

(1)mysqld --defaults-file="my-small.ini" --console --character-set-server=utf8 --basedir="C:\mysql-5.5.21-win32" --datadir="C:\mysql-5.5.21-win32\data"

(2)在配置文件的[mysqld]节点中添加:character-set-server = "utf8"

  • --character-set-server=charset

该启动参数在MySQL的各版本中可能有差异,具体参见文档。

注意: default-character-set这个参数已经在新版的MySQL中取消使用,在部分旧版中也已经deprecated而不起作用。 使用配置变量“character_set”(低于4.1.0的服务器版本)和“character_set_server”(4.1.0和更高的服务器版本)指定。

我测试的版本是5.5.21,查看版本号的方式,以下内容来自:查看mysql版本的四种方法

1 select version();
2 status;

3. 查看编码。

1 show variables like '%char%' ;
| character_set_client        | gbk
| character_set_connection | gbk
| character_set_database   | utf8
| character_set_filesystem  | binary
| character_set_results       | gbk
| character_set_server       | utf8
| character_set_system      | utf8

得到类似这样的结果,可以使用下面的方法修改编码(该方法仅对当前连接生效,并且不会改变已存储的数据的编码):

1 SET character_set_client = utf8;
2 SET character_set_results = utf8;
3 SET character_set_connection = utf8;

4. 内部编码。指数据库、表、字段的编码。以下内容来自:mysql修改表、字段、库的字符集

修改数据库字符集:

ALTER
 DATABASE
 db_name DEFAULT
 CHARACTER
 SET
 character_name [
COLLATE
 ...
]
;

把表默认的字符集和所有字符列(CHAR,VARCHAR,TEXT)改为新的字符集:

ALTER
 TABLE
 tbl_name CONVERT
 TO
 CHARACTER
 SET
 character_name [
COLLATE
 ...
]
 如:ALTER
 TABLE
 logtest CONVERT
 TO
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

只是修改表的默认字符集:

ALTER
 TABLE
 tbl_name DEFAULT
 CHARACTER
 SET
 character_name [
COLLATE
...
]
;
如:ALTER
 TABLE
 logtest DEFAULT
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

修改字段的字符集:

ALTER
 TABLE
 tbl_name CHANGE
 c_name c_name CHARACTER
 SET
 character_name [
COLLATE
 ...
]
;
如:ALTER
 TABLE
 logtest CHANGE
 title title VARCHAR
(
100
)
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

查看数据库编码:

SHOW
 CREATE
 DATABASE
 db_name;

查看表编码:

SHOW
 CREATE
 TABLE
 tbl_name;

查看字段编码:

SHOW
 FULL
 COLUMNS
 FROM
 tbl_name;

5. 连接方式。对于MySQL Connector/J方式,可以使用如下设置,来自“26.3.3.4. 使用字符集和Unicode”:

在MySQL服务器4.1之前,Connector/J支持每连接单一字符编码,能够从服务器配置自动检测到它,也能由用户通过使用useUnicode characterEncoding 属性配置它。

从MySQL服务器4.1版起,Connector/J支持客户端和服务器之间的单一字符编码,以及针对结果集中从服务器返回至客户端的数据的任意数目字符编码。

具体的连接示例:jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=utf8&autoReconnect=true

END. 以下内容来自:MYSQL 字符集问题

 MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

但是,传统的 程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?

    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时  character_set_server  被设定为这个默认的字符集;
    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为 character_set_server ;
    (5)当选定了一个数据库时, character_set_database  被设定为这个数据库默认的字符集;
    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database ,也就是这个数据库默认的字符集;
    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

猜你喜欢

转载自marsvaadin.iteye.com/blog/1717888