我现在有一个文件,其中有3000多个单词,我想对它进行分类,按小学(简单),初中(普通),高中(难)进行分类,但一直想不出来,下面是文件的一部分
A
- a(an) art. 一(个、件…)
- abandon v. 放弃,遗弃
- ability n. 能力; 才能
- able a.能够;有能力的
- abnormal a.反常的,不正常的
- aboard prep. / adv.搭乘
- abolish v.废除,废止
目前的困难:
- 替换a. perp. 等前缀
- 对多个解释的单词进行融合保留
- 最最重要的还是怎么按等级分类,前面的还能解决,这是真想不出来
下面有我的(mei yong de)代码: import re
d = eh.Dict("en_US")
ts = t.Translator(to_lang="Chinese")
f = open("word.txt","r",encoding='utf-8')
txt = f.readlines()
all_words = []
for line in txt:
word = re.findall(r'[A-Za-z]+',line)
translate = re.findall(r'[\u4e00-\u9fa5]+',line)
all_words = [word,translate]+all_words
我想要的结果:
1.能分成不同的等级
2.弄成[[单词,形容词/副词/介词等,翻译,用法],[同上],[同上] 等等 ]