unicode不能对汉字进行编码吗

如题所述

能。Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。

在Unicode中:汉字“字”对应的数字是23383(十进制),十六进制表示为5B57。在Unicode中,我们有很多方式将数字23383表示成程序中的数据,包括:UTF-8、UTF-16、UTF-32。UTF是“Unicode Transformation Format”的缩写,可以翻译成Unicode字符集转换格式,即怎样将Unicode定义的数字转换成程序数据。

扩展资料:

Unicode编码将世界上所有的符号都纳入其中,无论是英文、日文、还是中文等,大家都使用这个编码表,不会出现编码不匹配现象。每个符号对应一个唯一的编码,乱码问题不存在。

Unicode当然是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,“汉”这个字的Unicode编码是U+6C49。

Unicode固然统一了编码方式,但是它的效率不高,比如UCS-4(Unicode的标准之一)规定用4个字节存储一个符号,那么每个英文字母前都必然有三个字节是0,这对存储和传输来说都很耗资源。

参考资料:

百度百科-Unicode

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-10-12
Unicode是国际标准万国码的字符集编码,目的是对全世界的文字进行编码,便于全球间的信息化交流,也是电脑制造商必须遵照执行的字符集标准。本回答被提问者采纳
相似回答