用python调用ICTCLAS50进行中文分词

 
把你的程序和Date、ICTCLAS50.dll、Configure.xml放在一个目录下。
#coding:gb2312
from ctypes import *

dll=cdll.LoadLibrary("ICTCLAS50.dll")
dll.ICTCLAS_Init(c_char_p("."))
lpText = u"计算所汉语词法分析系统ICTCLAS调用测试"
strlen = len(c_char_p(lpText).value)
t =c_buffer(strlen*6)
bSuccess = dll.ICTCLAS_ParagraphProcess(c_char_p(lpText),c_int(strlen),t,c_int(0),1)
print t.value
list=t.value.split()
for i in xrange(len(list)):
    print  list[i].decode('gb2312')
dll.ICTCLAS_Exit()

运行结果:

计算/v 所/q 汉语/nz 词法分析/n 系统/n ICTCLAS/x 调用测试/n
计算/v
所/q
汉语/nz
词法分析/n
系统/n
ICTCLAS/x
调用测试/n

原文地址:https://www.cnblogs.com/banbana88/p/2413155.html