嗨� 2021-07-06 14:19 采纳率: 50%
浏览 706
已采纳

Python去除列表中的符号

['\xa0\xa0\xa0\xa0\ufeff\r', '\r', '\xa0\xa0\xa0\xa0九月初一,周宣带着来福、三痴出了江州城南门,往洪州方向而去,昨夜学习茶道时他已经向静宜仙子告过假,当时林涵蕴不在,静宜仙子淡淡的没什么表地'\xa0\xa0\xa0\xa0在路上三日,越过马回岭,过德安、永修,来到号称唐国西南第一大城的洪州。\r', '\r']

使用etree.HTML().xpath()爬出来的内容是一个列表,但是其中包含了这些符号,使用了多种方式都没有解决。如何只提取其中的文本?

  • 写回答

3条回答 默认 最新

  • Roc-xb 后端领域优质创作者 2021-07-06 14:46
    关注
    ls = ['\xa0\xa0\xa0\xa0\ufeff\r', '\r',
          '\xa0\xa0\xa0\xa0九月初一,周宣带着来福、三痴出了江州城南门,往洪州方向而去,昨夜学习茶道时他已经向静宜仙子告过假,当时林涵蕴不在,静宜仙子淡淡的没什么表地\xa0\xa0\xa0\xa0在路上三日,越过马回岭,过德安、永修,来到号称唐国西南第一大城的洪州。\r',
          '\r']
    res = ''.join(ls).replace('\xa0', '').replace('\ufeff', '').replace('\r', '')
    print(res)
    

    有帮助,望采纳!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 2024-五一综合模拟赛
  • ¥15 下图接收小电路,谁知道原理
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度
  • ¥30 关于#r语言#的问题:如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
  • ¥15 ETLCloud 处理json多层级问题
  • ¥15 matlab中使用gurobi时报错
  • ¥15 这个主板怎么能扩出一两个sata口
  • ¥15 不是,这到底错哪儿了😭