【语言处理与Python】5.7如何确定一个词的分类

形态学线索

从词的内部结构可能为这个词分类提供有用的线索。

例如:

-ness与形容词结合可能是一个名词;

-ment是与一些动词结合产生一个名词的后缀;

英语的动词也是形态复杂的。

例如:

-ing有可能是现在分词、也有可能是动名词

句法线索

一个词可能出现的典型上下文

例如:

假设我们已经确定了名词类,我们可以说,英语的形容词的句法标准是可以立即出现在一个名词前,或者紧跟在be或者very的后面

语义线索

一个词的意思对其词汇范畴是一个有用的线索。

新词

比如很多的新词都是名词,这些名词属于开放类;

介词被认为是封闭类,因为只有有限的词汇属于这个类别;

词性标记集中的形态学

例如有的词却有不同的形态,在更细粒度的分词上需要注意:

形式 类别 标记
go 基本 VB
goes 第三人称单数 VBZ
gone 过去分词 VBN
going 动名词 VBG
went 一般过去时 VBD

总之,没有一个“正确的方式”来分配标记,只有根据目标不同或多或少有用的方法。

原文地址:https://www.cnblogs.com/createMoMo/p/3100144.html