scrapy框架，命令提示符，python爬虫


##请求传参，深度爬取。需求：boss直聘岗位名称、岗位描述
import scrapy

#from bossPro.items import BossproItem

class BossSpider(scrapy.Spider):
    name = "boss"
    #allowed_domains = ["www.xxx.com"]
    start_urls = ["https://www.zhipin.com/web/geek/job?query=Python&city=101010100"]
    #定义解析详情页的函数
    #回调函数接受item
    def parse_detail(self,response):
        item=response.meta["item"]#回调函数接受item
        job_desc=response.xpath("//*[@id='main']/div[3]/div/div[2]/div[1]/div[2]//text()").extract()#返回的是一个包含字符串的列表

        job_desc="".join(job_desc)#将列表中的字符串拼接
        item["job_desc"]=job_desc
        #print(job_desc)
        yield item#将item提交给管道


    def parse(self, response):
        li_list=response.xpath("//*[@id='wrap']/div[2]/div[2]/div/div[1]/div[2]/ul/li")
        for li in li_list:
            job_name=li.xpath(".//div[1]/a/div[1]/span[1]/text()").extract_first()
            #实例化一个item对象
            item=BossproItem()
            item["job_name"]=job_name
            #print(job_name)
            detail_url="https://www.zhipin.com"+li.xpath("./div[1]/a/@href").extract_first()
            #对详情页发请求获取页面源码数据
            #手动请求的发送
            #请求传参：meta={}，可以将meta字典传递给对应的回调函数即parse_detail
            yield scrapy.Request(detail_url,callback=parse_detail,meta={"item":item})

通过cmd运行scrapy crawl boss没有出现报错，但是返回内容为空，仅仅显示项目所在的路径./bossPro/,网址代码和xpath路径没有错误，log_level=ERROR,DEBUG,INFO这三个值都试过没用，li_list=response.xpath("//*[@id='wrap']/div[2]/div[2]/div/div[1]/div[2]/ul/li")这段代码请求出来的结果也是一个空列表，希望能得到解答

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-06-03 19:27
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7594209
你也可以参考下这篇文章：Scrapy框架架构详解【python爬虫入门进阶】（23）
您还可以看一下 CSDN就业班老师的《Python全栈工程师》试听课课程中的 Scrapy框架爬取房屋信息实战小节, 巩固相关知识点

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python的网络爬虫框架-Scrapy爬虫框架的使用
2023-07-10 02:24

ζ小菜鸡的博客大家好我是小菜鸡，让我们一起学习Python的网络爬虫框架-Scrapy爬虫框架的使用（一起努力，咱们顶峰相见！！！）
python爬虫scrapy框架使用
2025-10-04 19:32

数据牧羊人的成长笔记的博客目录Scrapy的介绍Scrapy的优势Scrapy的架构安装Scarpy开发第一个爬虫创建第一个项目文件说明创建第一个爬虫爬虫包含的内容Scrapy项目的启动介绍Scrapy启动-命令启动scrapy命令方法1方法2Scrapy输出日志-了解Scrapy ...
Python Scrapy爬虫框架详解
2022-03-15 12:00

睿科知识云的博客 Scrapy 是一个基于 Twisted 实现的异步处理爬虫框架，该框架使用纯 Python 语言编写。Scrapy 框架应用广泛，常用于数据采集、网络监测，以及自动化测试等。提示：Twisted 是一个基于事件驱动的网络引擎框架，同样...
Python Scrapy网络爬虫框架学习资料（原创）
2024-05-26 15:30

1. 打开命令提示符或终端。 2. 使用`cd`命令切换到指定的项目目录。 3. 使用`scrapy startproject Baidu`命令创建一个名为Baidu的新项目。 4. 进入项目目录`cd Baidu`。 5. 创建一个爬虫文件`scrapy genspider baidu...
Python - 爬虫；Scrapy框架（一）
2025-05-06 08:38

MinggeQingchun的博客是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy是网页抓取框架，支持CSS选择器和XPath，可将数据以多种格式（如CSV、JSON、XML）导出。包含Spiders...
windows下搭建python scrapy爬虫框架步骤
2020-09-19 19:51

### Windows 下搭建 Python Scrapy 爬虫框架详解 #### 一、引言随着互联网技术的迅猛发展，网络爬虫成为了数据采集的一种重要手段。Python 作为一种强大的编程语言，因其简洁易懂的语法和丰富的第三方库支持，在...
windows7 32、64位下python爬虫框架scrapy环境的搭建方法
2020-09-19 22:05

### Windows 7 32/64位下Python爬虫框架Scrapy环境的搭建方法在本篇文章中，我们将详细介绍如何在Windows 7系统（32位与64位）上搭建Python爬虫框架Scrapy的运行环境。本文将涵盖环境搭建所需的所有步骤，包括必要...
Python爬虫---Scrapy框架---CrawlSpider
2024-01-28 00:00

velpro_!的博客在命令提示符中输入： scrapy shell https://www.dushu.com/lianzai/1115.html 2. 导入链接提取器：from scrapy.linkextractors import LinkExtractor 3. allow = () ：正则表达式，提取符合正则的链接 5. 查看...
【Scrapy爬虫框架】{0} ——Scrapy爬虫框架介绍
2020-12-22 12:58

Scrapy是一个功能强大并且非常快速的网络爬虫框架，是非常优秀的python第三方库，也是基于python实现网络爬虫的重要的技术路线。 Scrapy的安装：直接在命令提示符窗口执行pip install scrapy貌似不行。我们需要先...
Python 爬虫实战：Scrapy 框架高性能爬虫开发全攻略
2025-07-17 14:52

西攻城狮北的博客在当今数字化时代，数据已...而 Scrapy 框架则是 Python 爬虫领域中一颗璀璨的明珠，以其高性能、可扩展性和易用性受到众多开发者的青睐。本文将带你深入 Scrapy 框架，从基础到实战，全方位解锁高性能爬虫开发的奥秘。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月29日

scrapy框架，命令提示符，python爬虫

3条回答 默认 最新

问题事件

3条回答默认最新