爬虫无法运行，请大神帮忙看下

想爬取豆瓣读书的书籍的链接、名字、作者、出版日期，但是电脑一直没有反应，大家帮忙看看

import requests
import re
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
        }
content=requests.get('https://book.douban.com/',headers=headers).text
#print(content)
print("-----------")
pattern=re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>',re.S)
results=re.findall(pattern,content)
print("-----------")
print(results)
for result in results:
    url,name,author,date=result
    author=re.sub('\s','',author)
    date=re.sub('\s','',date)
    print(url,name,author,date)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-03-26 08:56
关注
用fiddler抓包看下，你发出的请求和得到的返回的数据，哪里有问题。
或者调试下。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

python爬虫下载PDF失败 python 爬虫
2023-03-27 05:35

回答 3 已采纳感谢两位。我刚刚分析了一下所有下载异常的文件，名字中都有冒号：，replace替换后现在可以下载了。
python 爬虫XHR获取失败 python 爬虫
2017-10-22 07:00

回答 2 已采纳你要用post去请求，我使用的是request库 import requests url = 'http://www.bjbus.com/home/ajax_news_list.php' hea
python小白求问，selenium安装成功后运行失败，求教大神 python selenium 有问必答
2022-02-08 01:42

回答 3 已采纳将谷歌浏览器驱动直接放在你python 的安装目录即可，如图如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
Python爬虫超级大神班-requests进阶-初识反爬- Scrapy处理翻页与实现模拟登录
2024-08-03 02:37

Python爬虫超级大神班 05-异步爬虫 04-requests进阶-初识反爬 03-数据解析 02-爬虫概念 01-Python基础 6.9 Scrapy处理翻页与实现模拟登录1 .mp4 817.6MB 6.8 Scrapy实战案例一1 .mp4 694.7MB 6.7 Scrapy基本...
python爬虫的理解问题 chrome python selenium 爬虫
2018-02-22 19:04

回答 4 已采纳 1. 你的理解是对的 2. 我把我的理解说一下, 比如说一个网页显示了商品的价格, 而且这个价格信息是网页的js代码请求了价格信息对应的url之后显示出来的 - 我用requests库
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 00:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
爬虫python 中国新闻网搜索引擎无法请求 python 有问必答
2021-12-23 02:17

回答 1 已采纳 headers缺少了cookie，这个网址通过js生成这__jsluid_h，__jsl_clearance这2个cookie，没有的话会输出js生成cookie然后再跳转到搜索结果页示例代码如下
python顶级大神吐血总结，Python爬虫学习的完整路线推荐
2021-10-22 09:28

java_500的博客爬虫变得越来越流行，不仅因为它能够快速爬取海量的数据，更因为有python这样简单易用的语言使得爬虫能够快速上手。对于小白来说，爬虫可能是一件非常复杂、技术门槛很高的事情，但掌握正确的方法，在短时间内做到...
python多线程爬虫如何在中断后继续上次的断点下载数据 python sql 数据挖掘
2021-06-03 07:53

回答 3 已采纳 redis记没成功的不就完事了，带同步访问，doge
python爬虫爬取腾讯新闻评论 json python 爬虫
2017-11-22 21:47

回答 3 已采纳需要先把内容的mainComment()去掉，它里面是一个json，然后就可以处理，\u是表示unicode的字符。 ``` In [24]: sess = requests.Session(
复制的python爬虫，在自己电脑上运行会报错，这个怎么解决啊？ python 有问必答
2021-05-23 09:47

回答 2 已采纳代码运行没有问题，检查一下requests版本和bs4版本，可以考虑升级一下。测试通过环境python3.7.6,bs4,'4.9.1',requests,'2.23.0'
Qt+python+爬虫
2020-12-22 05:36

爬虫API腾讯疫情接口QT显示自己一个做的一个小东西，很多部分不太完善，不喜勿喷！如果大神有小建议和指点的话，欢迎欢迎欢迎!!! 原理介绍通过request请求，获得数据用Json解析数据，对数据提取，将这个写成一个...
Python爬虫以及数据可视化分析
2020-12-25 09:43

反卷三明治的博客 Python爬虫以及数据可视化分析之B站动漫排行榜信息爬取分析 ...简单几步，通过Python对B站...PS: 作为Python爬虫初学者，如有不正确的地方，望各路大神不吝赐教[抱拳] 本项目将会对B站番剧排行的数据进行网页信息爬取以及
python编写爬虫小程序
2021-01-02 23:25

想到廖雪峰大神的python教程很经典、很著名。就想找找有木有pdf版的下载，结果居然没找到！！CSDN有个不完整的还骗走了我一个积分！！尼玛！！怒了，准备写个程序直接去爬廖雪峰的教程，然后再html转成电子书。 ...
Python爬虫开发基于Python实现的获取雪球网大神们的组合的调仓记录炒股股票数据采集抓取共两个版本.rar
2022-06-18 04:06

在本项目中，我们主要探讨的是使用Python进行网络爬虫开发，目的是获取雪球网上的大神们的投资组合调仓记录。雪球网是一个著名的金融投资社区，许多投资者在这里分享他们的投资策略和调仓信息，这对于研究股市动态和...
没有解决我的问题, 去提问

悬赏问题

¥50 大二的web前段开发静态网页纸质版
¥15 robocopy文件复制
¥15 unity安卓打包出现问题
¥15 爱快路由器端口更改错误导致无法访问
¥20 安装catkin时遇到了如下问题请问该如何解决呢
¥15 VAE模型如何输出结果
¥15 编译python程序为pyd文件报错：{"source code string cannot contain null bytes"
¥20 关于#r语言#的问题：广义加行模型拟合曲线后如何求拐点
¥15 fluent设置了自动保存后，会有几个时间点不保存
¥20 激光照射到四象线探测器，通过液晶屏显示X、Y值

爬虫无法运行，请大神帮忙看下

1条回答 默认 最新

悬赏问题

1条回答默认最新