解决“UnicodeEncodeError: 'gbk' codec can't encode character u'xa9' in position 24051: illegal multibyte sequence”错误

今天我在爬取一个网页时出现了下面这个错误:

UnicodeEncodeError: 'gbk' codec can't encode character u'xa9' in position 24051: illegal multibyte sequence

从这个错误来看应该是编码时出错了,于是我在网上查了些资料,找到了解决方法:

source_code.encode('GB18030')

解释:GB18030是GBK的父集,所以能兼容GBK不能编码的字符。

原文地址:https://www.cnblogs.com/yestreenstars/p/5524631.html