[转发] 有不少用户对 GBK 与 UTF-8 版本有什么区别不太了解, 在这给大家提供一些参考。GBK版本与UTF-8版本功能是一样的.只不过编码方式不同。 GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成 1。UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三 个字节)来编码。对于英文字符较多的网站则用UTF-8节省空间。

GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。 GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准,UTF-8编码的文字可以在各国各种支持 UTF8字符集的浏览器上显示。 比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛。GBK是国家编码,通用性 比UTF8差,不过UTF8占用的数据库比GBK大。 提示:如果您的网站客户群体主要是面向国内用户的,建议使用GBK版本,因为它可以节省空间,及相对utf-8版本来讲稳定一些。

GBK会更稳定一些? 这个就不得而知了,得再确认一下。
补充: 同一篇文章用 GBK 与 UTF-8 方式保存,大小上的差异:

joseph@e54:~$ stat -c '%s %n' cax.utf8 cax.gbk
1833 cax.utf8
1310 cax.gbk

 Leave a Reply

(required)

(required)

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

   
© 2011 网络杂谈 | 020i.com Suffusion theme by Sayontan Sinha