ohhiya 2023-10-19 23:59 采纳率: 0%
浏览 4

python网络爬虫基础

爬虫抓取网上图片,运行没有报错,但是也没有结果。请问:是什么原因,如何解决呢?

import  os

import requests
from bs4 import BeautifulSoup
headers = {
    'User-Agent':
        'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.46'
}
dirName = 'ImgLib'
if not os.path.exists(dirName):
    os.mkdir(dirName)
url = 'https://www.ugg.cn/'
response = requests.get(url,headers = headers)
#print(response.text)
content = response.text
page = BeautifulSoup(content,"html.parser")
#print(page)
name_list = page.select('div[class="GoodsSelector"]')
print(name_list)
#for name in list:
#    print(name.get_text())
img_url_list = page.select('img[id="img_big_0"]')
#print(img_url_list)
for img in img_url_list:
    print(img)
for name in name_list:
    img_name = name.get_text().replace('/','_')+'.jpg'
    print(img)
    img_style = img.attrs.get("style").split('""')[1].strip('/')
    #
    print(img_style)
    img_src = 'https://www.ugg.cn/gallery-v-0-558.html' + img_style
    print(img_src)
    img_content = requests.get(img_src,headers = headers).content
    imgpath = dirName = '/' + img_name
    with open(imgpath,'wb')as fp:
        fp.write(img_content)

  • 写回答

2条回答 默认 最新

  • threenewbee 2023-10-20 00:20
    关注

    你不是有print么?输出下,看看以上哪里开始不对的。

    评论

报告相同问题?

问题事件

  • 创建了问题 10月19日

悬赏问题

  • ¥20 c语言写的8051单片机存储器mt29的模块程序
  • ¥60 求直线方程 使平面上n个点在直线同侧并且距离总和最小
  • ¥50 java算法,给定试题的难度数量(简单,普通,困难),和试题类型数量(单选,多选,判断),以及题库中各种类型的题有多少道,求能否随机抽题。
  • ¥50 rk3588板端推理
  • ¥250 opencv怎么去掉 数字0中间的斜杠。
  • ¥15 这种情况的伯德图和奈奎斯特曲线怎么分析?
  • ¥250 paddleocr带斜线的0很容易识别成9
  • ¥15 电子档案元素采集(tiff及PDF扫描图片)
  • ¥15 flink-sql-connector-rabbitmq使用
  • ¥15 zynq7015,PCIE读写延时偏大