weixin_47791885 2021-12-17 21:35 采纳率: 41.7%
浏览 1467
已结题

python如何统计csv/Excel文件里面的某一列数据的词频?

有一列关键词数据,列中的每个数据包含若干个词组,大部分是用空格隔开,有个别是不规则的可能有,- ()等符号,部分数据如下:

搜索词
planters for indoor plants
planters
hanging planter
planter
gardening pots, planters & accessories
wall planter
self watering planters
self watering planter insert
hanging planters for indoor plants
planters for outdoor plants
succulent planters
wall planters for indoor plants

想通过python来实现将这几十万行的数据统计词频,并且标记词性(名词、动词、形容词等)介词for to等直接清除忽略
其中一些不规则的符号也去掉
最终结果写入原csv文件的第二个新建表,数据包含字段(关键字、频次、词性)

不知道这样的实现目的在python里面算不算高,初学python,想用于实际工作中

  • 写回答

3条回答 默认 最新

  • 笨鸟快飞呀 2021-12-18 09:40
    关注

    pandas库就可以轻松解决

    评论
  • wresource Android领域优质创作者 2021-12-23 18:39
    关注

    涉及语义分析等,可以调用相关的库实现

    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 1月1日
  • 已采纳回答 12月24日
  • 创建了问题 12月17日

悬赏问题

  • ¥15 我需要在PC端 开两个抖店工作台客户端.(语言-java)
  • ¥15 有没有哪位厉害的人可以用C#可视化呀
  • ¥15 可以帮我看看代码哪里错了吗
  • ¥15 设计一个成绩管理系统
  • ¥15 PCL注册的选点等函数如何取消注册
  • ¥15 问一下各位,为什么我用蓝牙直接发送模拟输入的数据,接收端显示乱码呢,米思齐软件上usb串口显示正常的字符串呢?
  • ¥15 Python爬虫程序
  • ¥15 crypto 这种的应该怎么找flag?
  • ¥15 代码已写好,求帮我指出错误,有偿!
  • ¥15 matlab+波形匹配算法