这个官网的代码:
#from nltk.corpus import inaugural
#print(inaugural.fileids()[:5])
#['1789-Washington.txt', '1793-Washington.txt', '1797-Adams.txt', '1801-Jefferson.txt', '1805-Jefferson.txt']
#print([fileid[:4] for fileid in inaugural.fileids()][:5])
#['1789', '1793', '1797', '1801', '1805']
容易发现fileid里面装了很多txt文档,而fileid[:4]代表每个文档对应的年份
import nltk
cfd = nltk.ConditionalFreqDist(
(target, fileid[:4])
for fileid in inaugural.fileids()
for w in inaugural.words(fileid)
for target in ['economic', 'citizen']
if w.lower().startswith(target))
plt.figure(figsize=(20, 10))
cfd.plot()
容易作图.
我的问题在于,怎么把fileid里面的txt换成本地的txt的,也就是用本地的数据来做图。
我在网上没有找到相对应的答案