python中字符串的处理总结

在爬取新浪财经7*24直播中, 遇到了Unicode编码中文转utf-8的问题, 采用如下代码可以实现转化

>>> a='\u76d1\u7ba1\u5bf929'
>>> a
'\u76d1\u7ba1\u5bf929'

>>> a=a.encode('latin-1').decode('unicode_escape')
>>> a
'监管对29'

在转换中遇到/的显示问题, 采用如下方法解决

li = re.sub(r'\/', '/', li)  # 先剔除类似'u5143GBP/USDu77ed'中/的\,避免误伤其他的

具体案例可见我的gitee