scrapy爬取网页信息时，没有递归显示，而是在第一条中全部显示了


 def start_requests(self):
        url='https://my.qidian.com/bookcase/'
        yield Request(url,cookies=self.cookie_dict)

    def parse(self, response, **kwargs):
        list_selection=response.xpath("//tbody/tr")
        for one in list_selection:
            title=one.xpath('//b/a[2]/text()').extract_first()
            type = one.xpath('//b/a[1]/text()').extract_first()
            update=one.xpath('td[3]/text()').extract_first()
            author=one.xpath('td[4]/a/text()').extract_first()

            item=QidianLoginItem()
            item['title']=title
            item['type']=type
            item['update']=update
            item['author']=author

            yield item

结果就是

这里就会发现一个问题，就是它的title，type都是一样的，当查看详细内容是发现：

他们的title，type在全部显示在一个title中，这是为什么，求大家帮忙讲解。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-Time 2021-10-30 10:31
关注
你是不是title和type取错值了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy 爬取图片时图片的url总是显示None python 有问必答
2021-12-04 01:41

回答 1 已采纳 img_url = div.xpath('./div/a/img/src').extract_first() src前面少了 @ 改成 img_url = div.xpath('./
如何利用scrapy爬取带标签的网页内容并保存到自己的服务器上？ mysql python sql
2018-02-09 09:34

回答 3 已采纳 1. 把整个爬取到的网页内容直接存储到数据库肯定是可以的，你之所以没有成功，应该是因为你的数据库中的相应字段错了，整个网页内容都比较长，一般都是要用text字段，甚至是LongText)（最大长度42
在以瀑布流方式翻页的网站,使用scrapy网络爬虫,但是只爬取了第一页数据,没有爬取第二页. python 爬虫
2021-09-05 19:18

回答 2 已采纳那叫ajax，
Python使用Scrapy爬取妹子图
2020-09-22 00:38

在Python的世界里，Scrapy是一个强大的爬虫框架，用于高效地爬取网页并提取结构化数据。本示例中，我们将探讨如何使用Scrapy爬取妹子图网站（meizitu.com）上的图片。首先，我们需要了解Scrapy的基本结构，包括...
python scrapy爬虫如果想要下一页但是没有href python 爬虫
2022-12-14 00:18

回答 1 已采纳你要模拟参数，具体代码如下： import http.client conn = http.client.HTTPSConnection("chl.cn") #page 5 #submit 下一页
scrapy 怎么爬取网页中标签栏下的所有标签? python 爬虫
2022-10-19 14:43

回答 1 已采纳
scrapy爬取百度图片时Forbid spider access python 有问必答
2021-06-13 23:12

回答 2 已采纳这个是百度反爬虫导致的，
python爬取二手房信息_使用Scrapy爬取链家二手房信息
2020-12-10 05:50

weixin_39669701的博客目录必要条件：1.Python 2.7 / Python 2.7以上2. 安装Scarpy 、MySQLdb3. Mysql数据库项目说明：本项目基于... 搜索小区名，在结果页面中找到小区名，小区名的超链接为第一层链接2. 根据第一层链接，进入小区描述页...
Scrapy框架时爬取网页时报错 python 有问必答
2021-05-26 16:56

回答 2 已采纳你的数据清洗方法用错了，参考一下：https://blog.csdn.net/qq_43004728/article/details/84586628，如有帮助，望采纳
用scrapy爬取站长素材无法下载图片 python 爬虫
2021-08-03 18:51

回答 2 已采纳找到原因了，是要在setting中加上MEDIA_ALLOW_REDIRECTS = True，貌似是中间件的内容，我还没学到，所以不清楚什么意思，有大佬可以解释一下吗看所有日志后会发现其实有地方报错
scrapy爬取图片，爬取不到 python 有问必答
2021-05-23 20:32

回答 2 已采纳你已经爬到图片连接了，这个看到的管道文件的代码怎样写，要对图片链接发送请求访问，然后保存才行
Python Scrapy中的POST请求发送和递归爬取
2023-09-23 14:30

茜茜是帅哥的博客需求分析：每一个页面对应一个url，则scrapy工程需要对每一个页码对应的url依次发起请求，然后通过对应的解析方法进行作者和段子内容的解析。重写爬虫应用文件中继承Spider类的类的里面的start_requests（self）这...
scrapy-爬取京东笔记本电脑信息问题 chrome python selenium 开发语言
2020-09-01 19:12

回答 2 已采纳 ``` browser.quit() return HtmlResponse(url=request.url, body=browser.page_source, re
使用Scrapy递归爬取网页
2016-11-05 17:23

lujian1989的博客 1. scrapy介绍与安装　Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。（百度百科的描述）　...
用Python 的 Scrapy 爬取网站
2017-12-14 16:58

软猫克鲁的博客用Python 的 Scrapy 爬取网站说到制作蜘蛛爬取网站听起来挺简单的，其实深究起来是个蛮综合的应用，有不少技能点需要点亮。比如：基本的Request/Response HTML，CSS，XPath，JavaScript等前端技能点即便你有这些...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月29日

悬赏问题

¥15 Workbench中材料库无法更新，如何解决？
¥20 如何推断此服务器配置
¥15 关于github的项目怎么在pycharm上面运行
¥15 内存地址视频流转RTMP
¥100 有偿，谁有移远的EC200S固件和最新的Qflsh工具。
¥15 有没有整苹果智能分拣线上图像数据
¥20 有没有人会这个东西的
¥15 cfx考虑调整“enforce system memory limit”参数的设置
¥30 航迹分离，航迹增强，误差分析
¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败

scrapy爬取网页信息时，没有递归显示，而是在第一条中全部显示了

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新