UTF-8与GBK详解

GBK编码:是指中国的中文字符,其它它包含了简体中文与繁体中文字符,另外还有一种字符“gb2312”,这种字符仅能存储简体中文字符。

UTF-8编码:它是一种全国家通过的一种编码,如果你的网站涉及到多个国家的语言,那么建议你选择UTF-8编码。

使用GBK每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

程序验证码很大程度与bom头有关

 

什么是BOM头?

BOM头是放在UTF-8编码的文件的头部的,占用三个字节,用来标识该文件属于UTF-8编码。现在已经有很多软件识别BOM头,但是还有些不能识别BOM头,比如PHP就不能识别BOM头,这也是用记事本编辑UTF-8编码后执行就会出错的原因了。

 

如何去掉BOM头?

去掉BOM头的办法,最简单就是使用editplus或ultraedit等软件来操作。具体展示如下:

 

1、使用editplus去除BOM头

 
编辑器调整为UTF8编码格式后,保存的文件前面会多出一串隐藏的字符(也即是BOM),用于编辑器识别这个文件是否是以UTF8编码。 
运行Editplus,点击工具,选择首选项,选中文件,UTF-8标识选择总是删除签名,然后对PHP文件编辑和保存后的PHP文件就是不带BOM的了。

2、使用ultraedit去除BOM头


打开文件后,“另存为”选项的编码格式里选择(UTF-8 无BOM头),确定就OK了。

 

猜你喜欢

转载自blog.csdn.net/weixin_48135624/article/details/114994018
今日推荐