str8="中国 和 韩国 的区别" # a=str8.find("Python") # print a b=str8.find("和") print b word=str8.split(" ") #Python3 和Spark 这里可以直接正确分割中文 print word for i in word: #python 2.x 需要这样输出 print i
#这是关于编码的问题
# print "-"*50
# data=str8.decode("utf-8").encode("gb2312")
# print type(data)
# data2=data.decode("gb2312")
# print type(data2)
# print data2.split(u" ")
# data3=data2.encode("utf-8").split(" ")
# print data3
# for i in data3:
# print i
结果:
7
['xe4xb8xadxe5x9bxbd', 'xe5x92x8c', 'xe9x9fxa9xe5x9bxbd', 'xe7x9ax84xe5x8cxbaxe5x88xab']
中国
和
韩国
的区别
--------------------------------------------------
<type 'str'>
<type 'unicode'>
[u'u4e2du56fd', u'u548c', u'u97e9u56fd', u'u7684u533au522b']
['xe4xb8xadxe5x9bxbd', 'xe5x92x8c', 'xe9x9fxa9xe5x9bxbd', 'xe7x9ax84xe5x8cxbaxe5x88xab']
中国
和
韩国
的区别