es6 字符串的扩展

在ES6之前,js字符串一直基于16位字符编码进行构建的(UTF-16),每16位的序列是一个编码单元,代表一个字符。length,charAt()等字符串属性和方法都是基于这种编码单元构造的。Unicode引入了扩展字符集,编码规则改变了。前2^16码位以16位的编码单元表示,超过这个范围就用32位表示。所以以前的charCodeAt等方法是无法正确返回32位的UTF-16字符的码点的。

charCodeAt() 方法可返回指定位置的字符的 Unicode 编码。这个返回值是 0 - 65535 之间的整数。

1、codePointAt正确返回 32 位的 UTF-16 字符的码点。对于那些两个字节储存的常规字符(前2^16码位以前),它的返回结果与charCodeAt方法相同。(并不是常规字符就在非常规字符前面)

codePointAt方法返回的是码点的十进制值,如果想要十六进制的值,可以使用toString方法转换一下。

2、String.fromCharCode()用于从码点返回对应字符 但是只能返回16位的字符,32位的不行。和charCodeAt相对

String.fromCodePoint 可以返回32位的字符  与codePointAt相对

原文地址:https://www.cnblogs.com/yudabing/p/7831697.html