怎样获取http://www.delixi-electric.com/cpzx/index.htm这个网站所有的PDF电器说明书

import requests
import urllib.request
from bs4 import BeautifulSoup
import re
import os

def collect_category(url):
    category_urls = []
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'}
    r = requests.get(url, headers = headers)
    #print (r.status_code)
    soup = BeautifulSoup(r.text, "html.parser")
    urls = soup.select("div.pro_menu > dl > dd > a")
    for i in urls:
        category_urls.append("http://www.delixi-electric.com/"+i.get("href"))
    print (category_urls)
    return category_urls

def collect_items(url):
    items_urls = []
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'}
    r = requests.get(url, headers = headers)
    soup = BeautifulSoup(r.text, "html.parser")
    urls = soup.select("#pro_list > li > a")
    for i in urls:
        items_urls.append("http://www.delixi-electric.com/"+i.get("href"))
    return items_urls

def download_pdf(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'}
    r = requests.get(url, headers=headers)
    soup = BeautifulSoup(r.text, "html.parser")
    urls = soup.select("body > div:nth-child(10) > div > div:nth-child(3) > ul > li > a")

    for i in urls:

        name = i.get_text()
        name = re.sub("/", "", name)
        print (name)

        if os.path.exists('D:/delixi/%s.pdf' % name):
            print("文件已存在")
            continue

        pdf_url = "http://www.delixi-electric.com/"+i.get("href")
        print (pdf_url)
        u = urllib.request.urlopen(pdf_url)
        print ("进入成功，正在下载......")
        block_sz = 8192
        with open('D:/delixi/%s.pdf' % name, 'wb') as f:
            while True:
                buffer = u.read(block_sz)
                if buffer:
                    f.write(buffer)
                else:
                    print('第%d个文件已下载' % n)
                    break
        print ("=====================")


url = "http://www.delixi-electric.com/dcyb/index.htm"
category_urls = collect_category(url)
print ("目录链接收集完毕")
n = 0
for i in category_urls:
    items_urls = collect_items(i)
    print ("准备开始下载PDF")
    for a in items_urls:
        n+=1
        download_pdf(a)
print ("全部文件下载完毕")

这是我写的代码，请帮我看一下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2019-10-16 20:04
关注
https://max.book118.com/html/2017/0513/106461563.shtm

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

德力西 LW12-16系列万能转换开关技术说明书.rar
2019-10-11 06:38

德力西 LW12-16系列万能转换开关技术说明书rar,德力西 LW12-16系列万能转换开关技术说明书
德力西 CDW2（DW15HH）系列万能式断路器技术说明书.pdf
2019-10-16 07:53

德力西 CDW2（DW15HH）系列万能式断路器技术说明书pdf,德力西 CDW2（DW15HH）系列万能式断路器技术说明书
德力西 JSZ3系列电子式时间继电器技术说明书.rar
2019-10-17 15:07

德力西 JSZ3系列电子式时间继电器技术说明书rar,德力西 JSZ3系列电子式时间继电器技术说明书
德力西 CDB3LE系列漏电断路器技术说明书.rar
2019-10-29 15:41

德力西 CDB3LE系列漏电断路器技术说明书rar,德力西 CDB3LE系列漏电断路器技术说明书
德力西CDLE6Y液晶型剩余电流动作断路器对折页.pdf
2019-09-16 15:07

德力西CDLE6Y液晶型剩余电流动作断路器对折页pdf,德力西CDLE6Y液晶型剩余电流动作断路器介绍：德力西电气推出了全新智能漏电断路器——CDLE6Y系列液晶型智能剩余电流动作断路器。作为一体式、多功能、可通讯、...
德力西变频器.pdf
2019-10-10 18:39

德力西变频器pdf,德力西（杭州）变频器有限公司目前坐落于西湖区，是德力西集团控股的高新技术企业，也是目前国内最具规模的集研发、生产、销售和技术服务为一体的变频调速器专业厂家之一。德力西（杭州）变频器...
solidworks electrical 元件库/设备库
2023-05-09 09:08

此元件库包含CHINT、Delixi、Mitsubishi、Omron、Schneider等常用的电气元件，有使用solidworks做电气设计的朋友可以拿来直接使用，以减少在建库过程中浪费的时间，从而提高工作效率。
Lucene踩坑总结
2018-09-25 22:43

Forward_duyu的博客这段时间稍微空闲下来，抽点空，记录下这段时间上工作遇到的问题。文章概要对自己这段时间在工作中使用Lucene遇到的一些问题进行总结和归纳，并将解决方法给出，以供大家学习和参考。详述问题1: 报错：Lock held...
常用导轨插座部件库.zip
2020-03-05 01:10

CHINT,DELIXI,Schneider Electric常用导轨部件库，EDZ格式和XML格式
vue解决部署文件缓存方式
2024-01-19 15:50

LingRuiBin的博客 vue2 配置打包输出文件名方式： const baseUrl = "./" const timestr = new Date().getTime() module.exports = { outputDir: "delixi", publicPath: baseUrl, // 根据你的实际情况更改这里 // 选项... lintOnSave:...
DELIXI变频器在空压机中的节能改造应用方案
2020-10-22 22:33

空气压缩机在国民经济和国防建设的许多部门中应用极广，特别是在纺织、化工、动力等工业领域中已成为必不可少的关键设备，是许多工业部门工艺流程中的核心设备。提供自动化生产所需的压缩空气足够的供气压力，是生产...
DELIXI网站asp版，带资料
2013-11-26 21:44

使用ASP程序模仿的DELIXI官方网站，带商品展示、后台管理、管理员添加修改删除等功能
漏电断路器的全球与中国市场2022-2028年：技术、参与者、趋势、市场规模及占有率研究报告
2022-02-24 20:41

麦田创投的博客报告页数: 150 图表数: 100 报告价格：¥16800 本文研究全球与中国市场漏电断路器的发展现状及未来发展趋势，分别从生产和消费的角度...Mitsubishi Electric Schneider Electric Siemens Honeywell Fuji Electric Rock
低压配电的全球与中国市场2022-2028年：技术、参与者、趋势、市场规模及占有率研究报告
2022-02-10 19:41

麦田创投-六六的博客本文研究全球与中国市场低压配电的发展现状及未来发展趋势，分别从生产和消费的角度分析...Schneider Electric Siemens Eaton ABB Mitsubishi Electric Fuji Electric Chint Group Toshiba Hager Xin Long Sen Yuan DEL
鼓风断路器的全球与中国市场2022-2028年：技术、参与者、趋势、市场规模及占有率研究报告
2022-02-28 10:20

琪琪520。的博客本文研究全球与中国市场鼓风断路器的发展现状及未来发展趋势，分别从生产和消费的角度分析鼓风断路器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场...Delixi Larsen & Toubro Chint Elec
LED投光灯的全球与中国市场2022-2028年：技术、参与者、趋势、市场规模及占有率研究报告
2022-02-20 14:48

麦田创投-晓晓的博客本文研究全球与中国市场LED投光灯的发展现状及未来发展趋势，分别从生产和消费的角度分析LED投光...针对产品特性，本文将其分为下面几类，主要分析这几类产品的价格、销量、市场份额及增长趋势。主要包括： 10瓦 80瓦 1
电子过载继电器行业调研报告 - 市场现状分析与发展前景预测（2021-2027年）
2021-09-22 09:45

贝哲斯报告中心的博客该报告涉及的主要国际市场参与者有ABB、GE Industrial Solutions、Rockwell Automation、Eaton、Littelfuse、Sprecher+Schuh、Siemens、Schneider Electric、GREEGOO、Finder、DELIXI GROUP、CHINT、MTE等。...
2021-2025年中国顶灯行业市场供需与战略研究报告
2021-09-30 09:22

贝哲斯报告中心的博客该报告涉及的主要国际市场参与者有OPPLE、PHILIPS、Panasonic、NVC、HY、TCL、AOZZO、FSL、DELIXI、LONON、CHNT、Midea、OSRAM、YANKON、CHANGFANG、MLS等。这些参与者的市场份额、收入、公司概况和SWOT分析都包含...
2022-2028年全球与中国电子过载继电器行业深度分析
2022-01-15 14:27

麦田创投-小宁的博客本文研究全球与中国市场电子过载继电器的发展现状及未来发展趋势，分别从生产和消费的角度分析电子过载继电器的主要生产地区、主要消费地区以及主要的生产商。...Schneider Electric DELIXI GROUP CHINT Sprecher+Sch
Delphi控件使用经验札记
2021-03-16 18:21

疯流人物的博客 end else if FADOQuery.fieldbyname('TypeID').AsString = AMMETER_DELIXI then begin subitems.Add(AMMETER_DELIXI_NAME); end else begin subitems.Add(''); end; 12、多线程的基本规则之一是不得从非GUI线程与...
没有解决我的问题, 去提问

悬赏问题

¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容

怎样获取http://www.delixi-electric.com/cpzx/index.htm这个网站所有的PDF电器说明书

2条回答 默认 最新

悬赏问题

2条回答默认最新