乘风的鸟 2022-08-05 10:54 采纳率: 55.6%
浏览 202
已结题

正则表达式返回结果为空列表,请问怎么解决?

请问我这段代码哪里错了,使用正则表达式返回的结果为空列表,怎么回事
import requests

import re
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "http://www.aiimg.com/"
res = requests.get(url=url,headers=headers)
response = res.content.decode('gb2312')
print(response)
img_url = re.findall(r'img\ssrc="(.*?)"',response,re.M)
print(img_url)
for photos in img_url:
print(photos)
photo_response = requests.get(url=photos,headers=headers).content.decode('gb2312')
for photo in photo_response:
for numbers in range(1,len(img_url)):
with open("imgs_"+str(numbers)+".jpg","wb") as fp:
fp.write(photo_response)
print("OK")

我的解答思路和尝试过的方法
爬取http://www.aiimg.com/上的图片
  • 写回答

3条回答 默认 最新

  • EdsionWang 2022-08-05 11:25
    关注
    
    
    import requests
    import re
    
    headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
    url = "http://www.aiimg.com/"
    res = requests.get(url=url,headers=headers)
    response = res.content.decode('gb2312')
    
    img_url = re.findall(r'<img[^>]+src=[\'"](http://[^\'"]+)[\'"]+', response, re.M)
    
    #print('get image urls:')
    print(img_url)
    numbers = 1
    for photos in img_url:
        print(photos)
        photo_response = requests.get(url=photos,headers=headers).content
        with open("imgs_"+str(numbers)+".jpg","wb") as fp:
            fp.write(photo_response)
        numbers += 1
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月8日
  • 已采纳回答 8月5日
  • 创建了问题 8月5日

悬赏问题

  • ¥15 visionmaster启动失败,提示为“机器不满足授权而被禁用”
  • ¥50 用logisim设计16位单时钟周期cpu
  • ¥15 IDEA中圈复杂度如何具体设置
  • ¥50 labview采集不了数据
  • ¥15 请上面代码做什么处理或什么混淆
  • ¥15 英雄联盟自定义房间置顶
  • ¥15 W5500网线插上无反应
  • ¥15 如何用字典的Key,显示在WPF的xaml中
  • ¥15 weautomate读取Excel表格信息然后填写到网页一直报错,如何解决?
  • ¥15 C#如何在Webview2中获取网页验证码