python使用记录

去重后,依据原来列表的顺序进行排序

   a = [1,1,4,5,2,2,9,9] m = list(set(a)) m.sort(key=a.index)

处理自然语言,去除停用词

  import nltk

  nltk.download('stopwords')

  [nltk_data] Error loading stopwords: <urlopen error [WinError 10054]
  [nltk_data] 远程主机强迫关闭了一个现有的连接。>

  输入from nltk.book import *:

  

  手动下载nltk数据集(所有的)https://pan.baidu.com/s/1oUsf-FgVAZnQAtZWRwiK4w 提取码:9sor

  然后把下载好的压缩包解压至上图中Searched in的一个目录下。重新输入from nltk.book import *:

  

原文地址:https://www.cnblogs.com/yvlian/p/10989233.html