\ u4e00-\ u9fa5什么意思?

如题所述

“\u4e00-\u9fa5”是unicode编码,一种全世界语言都包括的一种编码。(国际化功能中常常用到),\u4e00-\u9fa5是用来判断是不是中文的一个条件。

可以输入数字和汉字的正则表达式:^[0-9\u4e00-\u9fa5]{2,20}$就是if(!names.match(/^[\u4e00-\u9fa5]{2,20}$/))改成if (!names.match(/^[0-9\u4e00-\u9fa5]{2,20}$/))

下表总结了编码规则,字母x表示可用编码的位。

Unicode符号范围 | UTF-8编码方式 

(十六进制) | (二进制) 

——————–+——————————————— 

0000 0000-0000 007F | 0xxxxxxx 

0000 0080-0000 07FF | 110xxxxx 10xxxxxx 

0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx 

0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

根据上表,解读UTF-8编码非常简单。如果一个字节的第一位是0,则这个字节单独就是一个字符;如果第一位是1,则连续有多少个1,就表示当前字符占用多少个字节。

扩展资料:

世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。

Unicode就是其中的一种编码方式。

UTF-8的编码规则很简单:

1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。

2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。

参考资料:

百度-词条

温馨提示:答案为网友推荐,仅供参考
相似回答