为什么我只获取了链接的第一个数据啊

为什么我只获取了链接的第一个数据啊？怎么才能做出大致这样：前几行全为川菜，一种菜占一行。大家有什么办法吗？刚开始学，不太懂,谢谢了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-05-28 23:16
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

根据您提供的两张图片中的内容，我将尝试解释您遇到的问题，并提供一些可能的解决方案。

问题分析

XPath选择器错误：在您的代码中，item['cuisines'] = iist.xpath('./a/text()').extract_first() 这一行存在一个拼写错误，iist 应该是 lists。此外，extract_first() 方法只会提取第一个匹配的元素，如果您想获取所有元素，应该使用 extract() 方法。

遍历单个元素：在 parse_detail 方法中，您似乎只提取了第一个菜谱的名称和链接。您需要遍历所有菜谱元素。

数据结构问题：您需要确保每个菜系的数据能够按行排列，这通常意味着您需要在每个菜系下收集多个菜谱的信息。

解决方案

修复XPath选择器：首先，修复拼写错误，并使用 extract() 方法代替 extract_first()。

item['cuisines'] = list.xpath('./a/text()').extract()

遍历菜谱元素：在 parse_detail 方法中，您需要遍历所有的菜谱元素，并为每个菜谱创建一个字典或类似的数据结构。

def parse_detail(self, response): item = response.meta['item'] recipes = response.xpath('//div[3]/ul/li') for recipe in recipes: recipe_name = recipe.xpath('.//a[contains(@class,"cookname")]/text()').extract() recipe_link = recipe.xpath('.//a/@href').extract() # 假设您有一个列表来存储每个菜系的所有菜谱信息 item['recipes'].append({'name': recipe_name, 'link': recipe_link})

组织数据：确保您的数据结构能够按照菜系组织菜谱信息。您可以使用字典来存储每个菜系的名称作为键，其值为包含所有菜谱信息的列表。

理解Scrapy框架：您需要熟悉Scrapy框架中的parse方法和Request对象的使用。parse方法用于处理响应并提取数据，而Request对象用于异步请求网页。

使用XPath定位元素：您需要熟练使用XPath表达式来定位网页中的元素。XPath是一种在XML文档中查找信息的语言，它也适用于HTML文档。

参考资料

Scrapy官方文档：Scrapy Documentation
XPath教程：W3Schools XPath Tutorial

示例代码

这是一个简化的示例，展示了如何修复您的代码并遍历多个菜谱：

import scrapy class DouguoSpider(scrapy.Spider): name = 'douguo' allowed_domains = ['douguo.com'] start_urls = ['https://www.douguo.com/fenlei'] def parse(self, response): lists = response.xpath('/html/body/div[2]/div/div[7]/div[2]/ul/li') for list in lists: item = douguo() item['cuisines'] = list.xpath('./a/text()').extract() detail_url = 'https://www.douguo.com/' + list.xpath('./a/@href').extract()[0] yield scrapy.Request(url=detail_url, callback=self.parse_detail, meta={'item': item}) def parse_detail(self, response): item = response.meta['item'] recipes = response.xpath('//div[3]/ul/li') item['recipes'] = [] for recipe in recipes: recipe_name = recipe.xpath('.//a[contains(@class,"cookname")]/text()').extract()[0] recipe_link = recipe.xpath('.//a/@href').extract()[0] item['recipes'].append({'name': recipe_name, 'link': recipe_link}) yield item

请注意，这个示例假设douguo是一个定义了的item pipeline，您需要根据实际情况调整代码。希望这能帮助您解决问题！
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么我的第二行数据会覆盖第一行数据 java
2018-03-09 07:25

回答 5 已采纳 row 好像始终是0
我学的编程语言以后到底是怎么运用的？ c++ java php
2022-01-22 11:18

回答 3 已采纳我知道我知道！！！你可以研究一下java awt包下的robot！你可以先尝试一下用它模拟人手去，缩小和放大一个桌面窗口，等你能初步理解他是做什么的，再去动手试试能不能坐一些更好玩的东西，悄咪咪说一声
python gui编程设了两个滚动条为什么只出现一个？ python
2018-11-13 09:51

回答 1 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201811/13/1542102768_264697.png) 只有左边的有，右面的就没有，即使文本内容显示上去也没
为什么我说Rust是靠谱的编程语言
2015-05-16 02:59

Liigo的博客序言：本文试图帮您解答“我要不要（投入大量时间和精力）学习Rust语言？”这个问题。作者尽量较少的谈及Rust语言本身，反而尝试从Rust语言周边入手，长时间、大范围、多角度地考察，研判Rust语言是否靠谱，并给出尽...
怎么直接用机器语言编程? 开发语言有问必答
2022-07-23 12:09

回答 2 已采纳所谓的机器语言，是机器能看懂的语言，全是由0和1组成的命令，人理解起来很费劲，所有才有了后来的高级语言。（更直白一点：机器语言是让为了让机器理解的，不是为了给人理解的，机器语言的侧重点是计算机）汇编跟
初中生学习哪一种编程语言更容易学会？开发语言
2021-06-30 12:58

回答 10 已采纳如果你想走编程的路子，最好入门学C语言，特别是学好指针，C/C++的精髓就是指针。然后就是学数据结构-》计算机组成原理-》操作系统-》计算机网络这条路走下来，当然在数据结构后面可以转到C++上去学后面
获取原封不动的扫码数据纯java编程 java
2017-05-22 02:38

回答 3 已采纳 1、无焦点获取需要在厂商的配合下设置成串口模式安装驱动成功后，在计算机管理属性->设备管理器->端口中查看有新增的一个端口，监听该端口，怎么获取数据，具体百度一下串口通信 2、有输入框、
每个开发人员都应该学习的5种编程语言（上）
2022-09-07 08:00

新钛云服的博客新钛云服已累计为您分享686篇技术干货程序员编写代码的通用编程语言有很多种，大多数使用企业软件的程序员在退休前通常只使用一种编程语言。然而，也有一些程序员在日常工作中有机会使用多种编程语言。例如，如果...
R语言将一列内的多个数据分别提取 r语言
2023-02-17 14:47

回答 1 已采纳可以尝试使用正则表达式来实现1.for循环遍历 # 创建示例数据 data <- c("ID=CD266144.1:1", "Name=CD266144.1", "Dbxref=GeneID:1
为什么我编程的时候EM_MOUSE总显示未定义的标识符？ c++ c语言
2022-11-08 09:28

回答 3 已采纳 1、变量类型没有指定。2、指定类型的方式与C++混淆了，特别是在.c文件中容易出现这种错误。3、变量指定了类型，但是与使用的变量名不符合，使用的变量名会提示为未定义。
C++语言编程检查一个3位数是水仙花数 c++
2018-10-11 00:03

回答 8 已采纳 ``` #include using namespace std; int main() { int a, b, c, y, n = 0; cout > n;
为什么说Python是数据科学领域的最佳语言？
2022-06-07 08:00

梦想橡皮擦的博客近日，TIOBE 最新一期编程语言排行榜新鲜出炉，Python再次位居榜首。作为时下最火的编程语言，Python可以说是应用极其广泛，大到数据科学，小到运维、爬虫等等，各大领域随处可见Python的痕迹。人人都说Python好，但...
C++语言编程结合两个字符串 c++
2018-10-10 23:48

回答 2 已采纳 #include #include using namespace std; string StrCon(const string& a, const string& b) { strin
Python 实现自动获取种子磁力链接方式
2020-09-18 02:43

本文介绍如何使用Python编程语言编写脚本，实现自动获取磁力链接的过程。磁力链接是一种特殊的链接方式，它与传统的URL不同，不需要中心化的服务器来存放种子文件，而是通过BT（BitTorrent）协议实现点对点的文件...
如何设计一门计算机编程语言
2022-06-02 18:06

OPPO内核工匠的博客本文中，将主要关注设计开发一种计算机编程语言，对于其他类似的语言，比如MarkDown、数据查询语言、数据交换语言等不涉及。计算机编程语言自从诞生以来，不断发展，很多已经逐渐消失在历史的长河中，当前(2022年)最...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月28日

悬赏问题

¥100 求Web版SPC控制图程序包调式
¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀
¥15 C++为什么这个代码没报错运行不出来啊
¥15 一道ban了很多东西的pyjail题
¥15 关于#r语言#的问题：如何将生成的四幅图排在一起，且对变量的赋值进行更改，让组合的图漂亮、美观@（相关搜索：森林图）
¥15 C++识别堆叠物体异常
¥15 微软硬件驱动认证账号申请
¥15 GPT写作提示指令词
¥20 根据动态演化博弈支付矩阵完成复制动态方程求解和演化相图分析等

为什么我只获取了链接的第一个数据啊

1条回答 默认 最新

问题分析

解决方案

参考资料

示例代码

问题事件

悬赏问题

1条回答默认最新