饿罪图鉴 2021-12-18 14:35 采纳率: 85.7%
浏览 140
已结题

用xpath爬取文本时如何去掉非文本内容

问题相关代码
discribe =html.xpath('//div[@class="container-fluid"]//div[@class="work_b"]//text()')

img

在我爬取此段文本时,输出的数据是带有/r的

img

我要怎么做才能爬出纯文本内容?

  • 写回答

1条回答 默认 最新

  • 陈.py 2021-12-20 09:57
    关注
    
    discribe =html.xpath('normalize-space(//div[@class="container-fluid"]//div[@class="work_b"]//text())')
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 4月19日
  • 已采纳回答 4月11日
  • 创建了问题 12月18日