weixin_47791885 2021-12-17 21:35 采纳率: 41.7%
浏览 1608
已结题

python如何统计csv/Excel文件里面的某一列数据的词频?

有一列关键词数据,列中的每个数据包含若干个词组,大部分是用空格隔开,有个别是不规则的可能有,- ()等符号,部分数据如下:

搜索词
planters for indoor plants
planters
hanging planter
planter
gardening pots, planters & accessories
wall planter
self watering planters
self watering planter insert
hanging planters for indoor plants
planters for outdoor plants
succulent planters
wall planters for indoor plants

想通过python来实现将这几十万行的数据统计词频,并且标记词性(名词、动词、形容词等)介词for to等直接清除忽略
其中一些不规则的符号也去掉
最终结果写入原csv文件的第二个新建表,数据包含字段(关键字、频次、词性)

不知道这样的实现目的在python里面算不算高,初学python,想用于实际工作中

  • 写回答

3条回答 默认 最新

查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 1月1日
  • 已采纳回答 12月24日
  • 创建了问题 12月17日

悬赏问题

  • ¥15 请问读取环境变量文件失败是什么原因?
  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载