如题,想做用四六级➕3500匹配hp原著的分析,到单词都是原型,原文都是特殊形态,这样处理不了,求指教
收起
可以安装第三方分词模块,比如nltk可以实现规则动词的时态原型转换。下面是用法,打印出going的原型go
from nltk.stem import SnowballStemmer trans = SnowballStemmer('english') # 下面可以分析规则变形的谓语动词 a = trans.stem('going') print(a)
但是对go/went/gone这种不规则变化就无能为力了。可以自己创建本地字典,把不规则变形的词放在一起。
报告相同问题?