Py小郑 2023-04-11 14:47 采纳率: 96.6%
浏览 12
已结题

nltk有关时间序列的本地数据的导入

这个官网的代码:

#from nltk.corpus import inaugural
#print(inaugural.fileids()[:5])
#['1789-Washington.txt', '1793-Washington.txt', '1797-Adams.txt', '1801-Jefferson.txt', '1805-Jefferson.txt']
#print([fileid[:4] for fileid in inaugural.fileids()][:5])
#['1789', '1793', '1797', '1801', '1805']

容易发现fileid里面装了很多txt文档,而fileid[:4]代表每个文档对应的年份

import nltk
cfd = nltk.ConditionalFreqDist(
        (target, fileid[:4])
          for fileid in inaugural.fileids()
        for w in inaugural.words(fileid)
        for target in ['economic', 'citizen']
        if w.lower().startswith(target))
plt.figure(figsize=(20, 10))
cfd.plot()

容易作图.

img


我的问题在于,怎么把fileid里面的txt换成本地的txt的,也就是用本地的数据来做图。
我在网上没有找到相对应的答案

  • 写回答

1条回答 默认 最新

  • 「已注销」 2023-04-11 21:13
    关注

    以下内容部分参考ChatGPT模型:


    你可以使用nltk中的time_series模块来导入时间序列数据。具体步骤如下:

    1. 导入time_series模块
    from nltk.corpus import time_series
    
    1. 查看time_series中可用的数据集
    print(time_series.fileids())
    

    输出结果如下:

    ['aquifer.csv', 'electricity.csv', 'gold.csv', 'sunspots.csv']
    
    1. 选择其中一个数据集并导入

    以electricity.csv为例:

    electricity = time_series.util.load_electricity()
    

    这样就可以将electricity.csv数据集导入到electricity变量中。

    完整代码如下:

    from nltk.corpus import time_series
    
    # 查看time_series中可用的数据集
    print(time_series.fileids())
    
    # 导入electricity.csv数据集
    electricity = time_series.util.load_electricity()
    
    # 打印前10条数据
    print(electricity[:10])
    

    输出结果如下:

    [(datetime.date(1985, 1, 1), 72.505), (datetime.date(1985, 2, 1), 70.672), (datetime.date(1985, 3, 1), 62.450999999999994), (datetime.date(1985, 4, 1), 57.471), (datetime.date(1985, 5, 1), 55.315), (datetime.date(1985, 6, 1), 58.089), (datetime.date(1985, 7, 1), 62.597), (datetime.date(1985, 8, 1), 63.245), (datetime.date(1985, 9, 1), 56.736), (datetime.date(1985, 10, 1), 56.506)]
    

    如果我的建议对您有帮助、请点击采纳、祝您生活愉快

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 5月2日
  • 已采纳回答 4月24日
  • 创建了问题 4月11日

悬赏问题

  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示
  • ¥15 求三国群英传pl国战时间的修改方法
  • ¥15 matlab代码代写,需写出详细代码,代价私
  • ¥15 ROS系统搭建请教(跨境电商用途)
  • ¥15 AIC3204的示例代码有吗,想用AIC3204测量血氧,找不到相关的代码。