初识Spacy

之所以想接触Spacy,是看到其自称为工业级的应用,所以想尝试下
windows下安装Spacy:
    直接安装pip install spacy是会报错的
    解决方法:
    到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载spacy及其相关的包,挨个安装,最后安装spacy即可
         
            安装成功:
          
 下载常用的模型
         与nltk类似,spacy也需要下载一些常用的包或是模型之类的东西
  1. python -m spacy download en
  2. python -m spacy download de
  3. python -m spacy download fr
  1. python -m spacy download en_core_web_md

基础功能的测试:
    1. 断词与断句
    
     
     
    2. 词干化(Lemmatize)
    
     
 
    3.标注词性(POS Tagging)
    
     
 
    4.命名实体识别(NER)
    
     
    5.名词短语提取
    
     
    6. 基于词向量计算词间相似度
    
     
    
Spacy与中文:
    spacy对中文的支持调用的是jieba的接口,所以需要预先安装jieba,在调用时,使用
  1. nlp=spacy.load('zh')
   后面的操作与英文的类似
   但是只有断词还能用,其他功能需要有依赖的包库,所以,还不如直接用jieba来得直接

 

 

 

 









































 




原文地址:https://www.cnblogs.com/combfish/p/7505851.html