qq_42458215 2022-11-24 17:47 采纳率: 74.3%
浏览 1
已结题

这个爬虫代码无法除去大块的空白

问题遇到的现象和发生背景
用代码块功能插入代码,请勿粘
import  requests
from lxml import etree
url="http://bbs.e763.com"
data=requests.get(url).content.decode("gbk")
data=etree.HTML(data)
dat=data.xpath('//text()')
dat=''.join(dat).replace('/n','').replace('/r','').replace('/t','').replace(' ','')
for ddd in range(len(dat)):
    if(ddd is None):
        pass
    else:
        aa=dat

        print(aa)

运行结果及报错内容

img

  • 写回答

2条回答 默认 最新

  • honestman_ 2022-11-24 17:54
    关注

    是 \n 不是/n

    import  requests
    from lxml import etree
    url="http://bbs.e763.com"
    data=requests.get(url).content.decode("gbk")
    data=etree.HTML(data)
    dat=data.xpath('//text()')
    dat=''.join(dat).replace('\n','').replace('\r','').replace('\t','').replace(' ','')
    for ddd in range(len(dat)):
        if(ddd is None):
            pass
        else:
            aa=dat
            print(aa)
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月2日
  • 已采纳回答 11月24日
  • 创建了问题 11月24日

悬赏问题

  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 unity第一人称射击小游戏,有demo,在原脚本的基础上进行修改以达到要求
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)