- 字符集的概念:
字符集:就是–编码–>字符的映射
- 例如:
65-->A
- 例如:
ASCII
字符集:0-255
-128---127
在中国:
[00000000]
汉字 最多也不过256
个 常用的汉字3000
多 全部3w+
[00000000][11111111] 0--65535之间
- 用两个字节表示一个汉字:
gb2312
(只存了7000左右的汉字 少)–>GBK
- 用两个字节表示一个汉字:
Unicode编码集:
Unicode
规定:国 为例 在Unicode
有一个独特的号 假设是2976
Unicode
编码集给世界上大部分的语言每个字符都分配了一个号码
国
[gbk]
–>unicode[2976]
–>日本–>从Unicode
得到 国 字- 把字符转化成对应Unicode对应的编码 以适应不同的计算机平台
escape
把字符转化成各平台通用的Unicode编码
1 | var str = '中国'; |