weixin_40122379 2023-03-15 14:40 采纳率: 100%
浏览 29
已结题

python信息去重问题请教

img

大家好,我在网上收集了一些新闻标题数据,格式是csv的,里面有些新闻标题是重复的,但是有些新闻标题有出处来源(如上图),所以用python进行信息去重的时候,无法去除。想请教大家,如何对类似的信息进行去重,请指点,谢谢!

  • 写回答

3条回答 默认 最新

  • 於黾 2023-03-15 14:44
    关注

    你可以忽略空格后面的部分,只比较前面的部分

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月23日
  • 已采纳回答 3月15日
  • 创建了问题 3月15日

悬赏问题

  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line