嗨� 2021-07-06 14:19 采纳率: 50%
浏览 707
已采纳

Python去除列表中的符号

['\xa0\xa0\xa0\xa0\ufeff\r', '\r', '\xa0\xa0\xa0\xa0九月初一,周宣带着来福、三痴出了江州城南门,往洪州方向而去,昨夜学习茶道时他已经向静宜仙子告过假,当时林涵蕴不在,静宜仙子淡淡的没什么表地'\xa0\xa0\xa0\xa0在路上三日,越过马回岭,过德安、永修,来到号称唐国西南第一大城的洪州。\r', '\r']

使用etree.HTML().xpath()爬出来的内容是一个列表,但是其中包含了这些符号,使用了多种方式都没有解决。如何只提取其中的文本?

  • 写回答

3条回答 默认 最新

  • Roc-xb 后端领域优质创作者 2021-07-06 14:46
    关注
    ls = ['\xa0\xa0\xa0\xa0\ufeff\r', '\r',
          '\xa0\xa0\xa0\xa0九月初一,周宣带着来福、三痴出了江州城南门,往洪州方向而去,昨夜学习茶道时他已经向静宜仙子告过假,当时林涵蕴不在,静宜仙子淡淡的没什么表地\xa0\xa0\xa0\xa0在路上三日,越过马回岭,过德安、永修,来到号称唐国西南第一大城的洪州。\r',
          '\r']
    res = ''.join(ls).replace('\xa0', '').replace('\ufeff', '').replace('\r', '')
    print(res)
    

    有帮助,望采纳!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 labview程序设计
  • ¥15 为什么在配置Linux系统的时候执行脚本总是出现E: Failed to fetch http:L/cn.archive.ubuntu.com
  • ¥15 Cloudreve保存用户组存储空间大小时报错
  • ¥15 伪标签为什么不能作为弱监督语义分割的结果?
  • ¥15 编一个判断一个区间范围内的数字的个位数的立方和是否等于其本身的程序在输入第1组数据后卡住了(语言-c语言)
  • ¥15 游戏盾如何溯源服务器真实ip?
  • ¥15 Mac版Fiddler Everywhere4.0.1提示强制更新
  • ¥15 android 集成sentry上报时报错。
  • ¥50 win10链接MySQL
  • ¥15 抖音看过的视频,缓存在哪个文件