小谈Vim打开文件开头的<feff>

       在本地Windows机上开发的PHP程序上传到linuxserver上后,通过浏览器訪问对应接口。发现返回的数据前多了一个莫名的字符‘-’,甚为不解。之后通过网络抓包的方式,查看到接口返回数据前多了 EF BB BF。

出现了如此令人不知所以然的bug总是极度让人抓狂。经过了几番尝试之后,仍然不能得以解决,但也隐隐感认为可能是字符编码的问题,遂用PHPStorm新建了一个文件,然后又一次将之前出bug的文件内容重写了一遍(庆幸文件不是太大,用svn的话,应将文件回滚到之前没有bug的版本号),然后又一次上传。问题竟然攻克了。

喜悦中就此作罢,并没有深究当中的缘由。

       原本以为bug就此解除,结果之后又碰到了一次,实在不能忍。这次查看代码并非採用在本机上改然后又一次上传server的方式,而是直接在server上用vim打开逐行查看。结果惊喜出现了。vim的文件头显示多了‘<feff>’字符。直觉告诉自己这就是罪魁祸首。于是进一步探究了<feff>字符。

       这里首先说一下utf8、utf16、utf32编码。由于这样的编码相应多个字节,所以一般utf16和utf32会用BOM(Byte Order Mark,为不可见字符)标识内部编码的字节序(Big/Litttle Endian),而utf8加不加BOM都能够。一般我们用的编辑器utf8编码是没有加BOM标识的,可是windows下的记事本却会将utf8编码的文件前加上BOM标识。

而这个BOM标识即相应着linux环境下vim打开后出现的<feff>字符。

<feff>字符会出如今<?php ...?>的前面。PHP对这种文件进行解析时。会将这个字符输出,从而导致了上述的bug。

       PS:还是少用记事本打开或编辑utf8编码的代码,血的教训啊。。!

原文地址:https://www.cnblogs.com/yjbjingcha/p/6869458.html