宁有种乎! 2023-03-26 16:21 采纳率: 50%
浏览 111
已结题

怎么从html上正确抓取数据呀?

请问码友们我在爬取这个房地产数据的时候,为何从html上抓取信息失败了呀?代码显示print()输出值为空是怎么回事?明明selector路径是正确的。


for page in range(1, 5): 
    print('===========================正在下载第{}页数据================================'.format(page))
    
    time.sleep(3)
   
    url = 'https://sh/'.format(page)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
   
    
    response = requests.get(url=url, headers=headers)
    html_data = response.text #字符串

    
    selector = parsel.Selector(html_data)
    lis = selector.css('body > div.content > div.leftContent > ul > li')

    print(lis)
   
    

img

  • 写回答

4条回答 默认 最新

  • cjh4312 2023-03-26 16:27
    关注

    用xpath就够了,不需要parsel框架,多余了。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(3条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 3月27日
  • 已采纳回答 3月26日
  • 修改了问题 3月26日
  • 修改了问题 3月26日
  • 展开全部

悬赏问题

  • ¥170 如图所示配置eNSP
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效
  • ¥15 悬赏!微信开发者工具报错,求帮改
  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥15 键盘指令混乱情况下的启动盘系统重装