python爬虫代码出现报错

代码如下：

import urllib.request
url='https://tj.lianjia.com/ditiezufang/li110458004/'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'}
request = urllib.request.Request(url,headers=headers)
response = urllib.request.urlopen(request)
if response.status==200: #判断是否正常响应
html=response.read().decode('utf-8')
## 编写正则表达式
import re
reg='data-src="(.*o_auto)|(.*\.jpg)"\n'#源代码格式图片
imgre=re.compile(reg)
imglist = imgre.findall(html)
## 保存到本地数据库
import os
os.chdir('C:\\Users\\90541\\Desktop\\数据分析\\pycode\\picture')# 工作路径指向这个目录
x=1
for img in imglist:
img=img.replace('250x182','780x439') 这一步报错了
urllib.request.urlretrieve(img,'%s.jpg' % x)#直接将远程数据下载到本地
x+=1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2021-06-23 18:09
关注
reg='data-src="(.*o_auto)|(.*\.jpg)"\n'#源代码格式图片

你正则中有两个（），每次会获取两个子匹配结果，imglist的每个元素都是包含两个子匹配结果的元组。

应该改成

reg='data-src="(.*o_auto|.*\.jpg)"\n'#源代码格式图片

或者

reg='data-src="((?:.*o_auto)|(?:.*\.jpg))"\n'#源代码格式图片

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 4
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python 爬虫代码不报错，也不显示爬取内容 python 有问必答
2021-04-22 11:19

回答 4 已采纳代码逻辑问题，main函数里只有计算耗时的部分，没有调用get_html、parse_html等函数。
pyThon爬虫多进程报错 python
2022-10-05 08:14

回答 3 已采纳带插件的浏览器，一个配置文件只能打开一个浏览器。想要多进程，需要有多个浏览器配置文件。利用生成器输出配置文件路径，避免多进程用到同一个路径。进程不能太多，不然程序会在某一个进程中卡死不动……没有具体的
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
Python 爬虫代码不报错，也不显示爬取内容，求解
2021-12-26 19:31

cortanaji的博客 #coding":"utf-8 import requests import hashlib import time import random import json class Youdao(object): def __init__(self,word): self.url =' ...smartresult=rule' self.header.
python 爬虫 post请求报错 python 有问必答
2022-01-24 18:49

回答 3 已采纳不是很明白json(dete)这一步是什么意图，好像直接写dete才好用哦。 import requests import json uil = 'https://www.dcguanwang.c
Python爬虫代码报错就解答 https python 有问必答
2021-10-23 21:21

回答 1 已采纳 user-agent，不是user_agent，中干线，不是下划线，user-agent打错被反扒检查出来没有正确返回json内容吧
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
python爬虫不报错也不出结果？
2024-05-28 22:57

m0_45207459的博客刚学爬虫对着视频想爬个网络小说但是代码写完不报错也不出结果，大佬们帮忙看看啥情况。# 从元组中取出部分链接进行拼接，获取每章的页面链接。# XPATH筛选出文本数据，并将数据列表转换成字符串。print("正在下载" ...
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
python爬虫基础小题目报错 python
2022-04-12 13:59

回答 3 已采纳题主，你代码里链接写错了，是点号你写成了逗号 link="http://www.santostang.com/"
python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
python 爬虫报错求救
2020-12-22 02:37

raise JSONDecodeError(“Expecting value”, s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)报错! 在找到某度文库文档的js文件链接后想用json.loads()进行解析...
python爬虫代码运行之后不报错也没有结果_看完！一小时带你入门Python爬虫
2020-12-14 13:03

weixin_39615643的博客一、什么叫爬虫爬虫，又名“网络爬虫”，就是能够自动访问互联网并将网站内容下载下来的程序。它也是搜索引擎的基础，像百度和GOOGLE都是凭借强大的网络爬虫，来检索海量的互联网信息的然后存储到云端，为网友提供...
Python爬虫带header报错
2020-08-22 12:53

鹿上的程序媛的博客 Python爬虫带header报错解决方法不得不说爬虫理论看起来简单，操作起来就报这个错那个错，今天记录一下爬百度贴吧报过的错，以及解决方案。 1.requests.exceptions.InvalidHeader: Invalid return character or ...
python爬虫常见报错_python爬虫入门常见错误集合
2020-11-28 12:43

weixin_39911998的博客在入门爬虫的时候遇到不少问题，和不是唯一的解决方法的方法，总结整理一下，供大家学习交流。syntaxerror: invalid syntax语法错误：无效语法syntaxerror: unexpected EOF while parsing语法错误：多了无法解析的...
没有解决我的问题, 去提问

悬赏问题

¥30 Matlab打开默认名称带有/的光谱数据
¥50 easyExcel模板动态单元格合并列
¥15 res.rows如何取值使用
¥15 在odoo17开发环境中，怎么实现库存管理系统，或独立模块设计与AGV小车对接？开发方面应如何设计和开发？请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
¥15 CSP算法实现EEG特征提取，哪一步错了？
¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
¥15 vue3前端取消收藏的不会引用collectId
¥15 delphi7 HMAC_SHA256方式加密
¥15 关于#qt#的问题：我想实现qcustomplot完成坐标轴
¥15 下列c语言代码为何输出了多余的空格

python爬虫代码出现报错

3条回答 默认 最新

悬赏问题

3条回答默认最新