utf-8与gb2312的区别

举报该问题

推荐答案 2013-12-28

不同的编码。

各个国家和地区所制定的不同 ANSI 编码标准中，都只规定了各自语言所需的“字符”。比如：汉字标准（GB2312）中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义：
1. 使用哪些字符。也就是说哪些汉字，字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。
2. 规定每个“字符”分别用一个字节还是多个字节存储，用哪些字节来存储，这个规定就叫做“编码”。
各个国家和地区在制定编码标准的时候，“字符的集合”和“编码”一般都是同时制定的。因此，平常我们所说的“字符集”，比如：GB2312, GBK, JIS 等，除了有“字符的集合”这层含义外，同时也包含了“编码”的含义。
“UNICODE 字符集”包含了各种语言中使用到的所有“字符”。用来给 UNICODE 字符集编码的标准有很多种，比如：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。
1、ISO-8859-1：
最简单的编码规则，每一个字节直接作为一个 UNICODE 字符。比如，[0xD6, 0xD0] 这两个字节，通过 iso-8859-1 转化为字符串时，将直接得到 [0x00D6, 0x00D0] 两个 UNICODE 字符，即 "�0�0�0�4"。
反之，将 UNICODE 字符串通过 iso-8859-1 转化为字节串时，只能正常转化 0~255 范围的字符。

2、GB2312,BIG5,Shift_JIS,ISO-8859-2
把 UNICODE 字符串通过 ANSI 编码转化为“字节串”时，根据各自编码的规定，一个 UNICODE 字符可能转化成一个字节或多个字节。
反之，将字节串转化成字符串时，也可能多个字节转化成一个字符。比如，[0xD6, 0xD0] 这两个字节，通过 GB2312 转化为字符串时，将得到 [0x4E2D] 一个字符，即 '中' 字。
“ANSI 编码”的特点：
1. 这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。
2. “UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。

3、UTF-8,UTF-16,UnicodeBig
与“ANSI 编码”类似的，把字符串通过 UNICODE 编码转化成“字节串”时，一个 UNICODE 字符可能转化成一个字节或多个字节。
与“ANSI 编码”不同的是：
1. 这些“UNICODE 编码”能够处理所有的 UNICODE 字符。
2. “UNICODE 字符”与“转换出来的字节”之间是可以通过计算得到的。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/zjt7Bjzv7OOBOjzXvB.html

其他回答

第1个回答 2013-12-28

用最易懂的说法就是UTF-8里包括GB2312。UTF-8是国际通用的标准（包括世界所有的语言），而GB2312（只是简体中文）只适合做中文的网站。假设你想做个中文网页，但是还可以翻成英文的话，就得用UTF-8。如果用GB2312做的话，只能给中国人看看拉。本回答被网友采纳

第2个回答 2013-12-28

其实没有太大区别，只是2种不同的编码方式。一半建议英文比较多的网站用utf-8，中文为主的网站用gbk或gb2312。meta头标签里面的charset是设定该网页显示时候的编码方式（简单的理解为html里面的所有字符也没什么问题）。

第3个回答 2013-12-28

http://zh.wikipedia.org/w/index.php?title=UTF8&variant=zh-cn最简单的区别:utf-8用3个字节表示中文字符, gb2312则是用2个

第4个回答推荐于2017-09-20

GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码。
gbk编码是对gb2312编码的扩充，容纳的汉字更多，但仅仅是扩充，没有质的变化。保留了所有gb2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码.
gb18030编码是在gbk编码基础上的扩充，因为汉字更多，仅仅使用两位编码已经不能容纳要求的汉字，所以采用了2/4位混和的办法，可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容gb2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符)unicode编码(也就是UTF编码)：俗称万国码，致力于使用统一的编码准则表达各国的文字。
为表达更多的文字，utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以3字节的方式处理中文，带来了兼容性的问题，原有的gbk,gb2312,gb18030编码文件都不能正常的处理,还有很长的路要走。

1 2 下一页

相似回答

UTF-8和GBKUTF8GB2312之间有什么区别答：GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:GBK、GB2312--Unicode--UTF8UTF8--Unicode--GBK、GB2312pCSS5简单从功能上说:1、GBK通常指GB2312编码只支持简体中文字2、utf通常指UTF-8,支持简体中文字、繁体中文字...

charset=iso-8859-1,charset=utf-8和charset=gb2312的区别答：简单的说就是GB2312是国标,而UTF-8则是国际标准 也就是说GB2312只是针对中国的访客打开浏览不用进行相应的设置而UTF-8则是国际通用的编码方式

UTF-8 GBK UTF8 GB2312 Unicode 之间的区别和关系答：一、主体不同 1、UTF-8 GBK ：中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订，国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式。2、UTF8 GB2312：是基于 1980 年发布的《信息交换用汉字编码字符集基本集》，是中文信息处理...

utf-8与gb2312的区别答：不同的编码。各个国家和地区所制定的不同 ANSI 编码标准中，都只规定了各自语言所需的“字符”。比如：汉字标准（GB2312）中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义：1. 使用哪些字符。也就是说哪些汉字，字母和符号会被收入标准中。所包含“字符”的集合就叫做“...

gb2312编码与utf-8编码的区别?答：UTF-8是国际编码，GB2312是简体中文编码！如果做得是外贸之类的网站就最好用UTF-8，如果是自己个人网站就用GB2312！

utf8与gb2312有什么区别答：GB2312是GBK的子集，GBK是GB18030的子集 GBK是包括中日韩字符的大字符集合如果是中文的网站推荐GB2312 GBK有时还是有点问题为了避免所有乱码问题，应该采用UTF-8，将来要支持国际化也非常方便 UTF-8可以看作是大字符集，它包含了大部分文字的编码。使用UTF-8的一个好处是其他地区的用户（如香港...

说说utf-8 和gb-2312的区别答：UTF-8 在它的表示中使用值100xxxxx的几率超过50%，而现存的实现如ISO 2022， 4873， 6429，和8859系统，会把它错认为是C1 控制码。因此产生了UTF-7.5编码。GB2312码是中华人民共和国国家汉字信息交换用编码，全称《信息交换用汉字编码字符集——基本集》，由国家标准总局发布，1981年5月1日实施...

关于在xml中输入中文的问题答：ISO8859-1，通常叫做Latin-1。Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符。而gb2312是标准中文字符集。UTF-8 是 UNICODE 的一种变长字符编码，即 RFC 3629。简单的说——大字符集。可以解决多种语言文本显示问题，从而实现应用国际化和本地化。对系统来讲，UTF-8 编码可以通过屏蔽位和...

5ucms安装如何在Gb2312版本与Utf-8之间选择?答：关于utf-8编码 unicode编码(也就是UTF编码)：俗称万国码，致力于使用统一的编码准则表达各国的文字。为表达更多的文字，utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以3字节的方式处理中文，带来了兼容性的问题，原有的gbk,gb2312,gb18030编码文件都不能正常的处理,还有很长的路要走...

大家正在搜

gb2312和gbk的区别 gb2312和utf8 gb2312转utf8 gb2312转换为utf8代码 utf8和gbk区别字符串由gb2312转utf8 gb2312和gbk gbk和gb2312兼容吗 utf8与gbk