怎么从html上正确抓取数据呀？

请问码友们我在爬取这个房地产数据的时候，为何从html上抓取信息失败了呀？代码显示print()输出值为空是怎么回事？明明selector路径是正确的。


for page in range(1, 5): 
    print('===========================正在下载第{}页数据================================'.format(page))
    
    time.sleep(3)
   
    url = 'https://sh/'.format(page)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
   
    
    response = requests.get(url=url, headers=headers)
    html_data = response.text #字符串

    
    selector = parsel.Selector(html_data)
    lis = selector.css('body > div.content > div.leftContent > ul > li')

    print(lis)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
cjh4312 2023-03-26 16:27
关注
用xpath就够了，不需要parsel框架，多余了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

怎么从html上正确抓取数据呀？ python
2023-03-26 16:21

回答 4 已采纳用xpath就够了，不需要parsel框架，多余了。
为什么用selenium抓取不到淘宝网页数据？ chrome python selenium 有问必答
2022-01-24 12:19

回答 2 已采纳 xpath写错了
数据抓取都用什么工具好些？ python
2020-04-10 12:09

回答 1 已采纳使用selenium吧字数补丁
Cython 是什么编程语言？为什么你有必要学习一下
2022-07-13 11:50

Python开发者的博客【导语】：这篇文章主要介绍了Cython编程语言，它是Python语言的超集，简而言之：Cython就是具有 C 数据类型的 Python。通过把Cython编译为C语言，运行程序。不仅保留了Python开发方便的特点，还能提升代码的运行...
vivado怎么用来抓取仿真信号并给matlab处理？ fpga开发 matlab 开发语言
2022-04-07 11:00

回答 1 已采纳 verilog 有对文件读写的函数，可以将仿真波形中需要的数据写入文件。
请问数据抓取系统(spider)怎样发现web上出现的一些链接啊？
2016-01-03 07:05

回答 1 已采纳访问html，其中包含``标记，它们就是链接。对html解析就可以得到。
如何分析并抓取一个网页满足特定日期条件的所有数据？ python
2022-06-12 17:23

回答 1 已采纳抓取网页数据的几种方法_LiZhen798的博客-CSDN博客_网页数据抓取相信所有个人网站的站长都有抓取别人数据的经历吧，目前抓取别人
vba数据抓取屏幕数据_如何使用屏幕抓取工具从Web提取数据
2020-07-10 15:55

cumo3681的博客 vba数据抓取屏幕数据完美的Internet可以按照客户选择的格式（无论是CSV，XML，JSON等）向客户提供数据。真正的Internet有时会通过提供数据来取笑，但通常以HTML或PDF文档格式提供，而这些格式旨在显示数据比数据...
我想问一下为什么我这个程序只能爬到第一页的数据呀，怎么改才能抓取全部呢？ python
2022-04-15 16:40

回答 1 已采纳这个时候你就要通过自己的观察，页面怎么跳到下一页，我看着你这个，url最后有一个=1估计就是指的第一页，那就=2就是第2页，做一个循环然后动态改变=n，然后不就可以想爬几页，爬几页，这只是假设，你要去
如何从网站上抓取所有内容？ [关闭] html php windows
2011-04-25 14:55

回答 8 已采纳 htttrack will work just fine for you. It is an offline browser that will pull down websites. You
百度阅读改怎么抓取目录呢？ python
2021-06-05 09:47

回答 1 已采纳他的目录就在文档里，不过做了unicode编码，在第140行，bookInfo['catalogs']后边就是目录信息了，你需要把他用ascii码和汉字替换掉里面的内容用js的eval这个内容，就
网页抓取 - 完整指南
2023-01-28 11:57

海拥✘的博客 Web Scraping，也称为数据提取或数据抓取，是从网站或其他来源以文本、图像、视频、链接等形式提取或收集数据的过程。当特定网站没有官方 API 或对数据访问有限制时，Web Scraping 很有用。它具有价格监控、媒体监控...
如何从网页上抓取我想要的图片? 爬虫
2015-09-10 08:49

回答 1 已采纳直接用IE F12，找到图片元素，得到地址，就可以抓。也可以另存为网页，然后在文件夹中找。
如何用Python爬数据？（一）网页抓取
2018-03-04 00:00

nkwshuyi的博客本文为你演示如何从网页里找到感兴趣的链接和说明文字，抓取并存储到Excel。（由于微信公众号外部链接的限制，文中的部分链接可能无法正确打开。如有需要，请点击文末的“阅读原文”按钮，访问可以正常显示外链的...
【R语言编程基础】【课后习题答案】【全】
2022-10-05 13:50

爱笑的冷面鬼的博客【R语言编程基础】【课后习题答案】【全】
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 3月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月26日
展开全部

悬赏问题

¥170 如图所示配置eNSP
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥15 键盘指令混乱情况下的启动盘系统重装

怎么从html上正确抓取数据呀？

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新