跟百度学编码 百度首页用的是gb2312,这个和早期的设定肯关系,另外一个是面向国内也没必要utf8,第三是占用的空间小一倍,而结果页面使用gbk是因为抓取页面的字符集,比较广泛,不像首页百度能自己决定。