学习爬虫遇到问题，请各位提供思路

运行报错，有点搞不清楚是哪错了，求解答，提供斯路，学习学习，谢谢

import scrapy
from P2.items import P2Item

class TestSpider(scrapy.Spider):
name = 'test'
allowed_domains = ['zb.yfb.qianlima.com']
start_urls = ['http://zb.yfb.qianlima.com/yfbsemsite/mesinfo/zbpglist']

def parse(self, response):
    node_list = response.xpath("//*[@id="contentTable"]/tbody")

    items=[]
    for node in node_list:

        item = P2Item()

        time = node.xpath("./td[1]/text()").extract()
        place = node.xpath("./td[2]/text()").extract()
        title = node.xpath("./td[4]/a/text()").extract()
        
        item['time'] = name[0]
        item['place'] = title[0]
        item['title'] = info[0]
        items.append(item)
        
    return items
    #pass

这是代码

尝试该过网页抓取的xpath的语句不对

我想要达到的结果

最后我想达到的效果是
日期状态项目名称
这样的一个文件

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
快乐小土狗 2022-07-15 15:32
关注
你看这："//[@id="contentTable"]/tbody" ，你这里是不是有4个双引号，从左往右开始，第一个双引号找离它最近的一个双引号配成一对。"//[@id="
"]/tbody"也是一队，那你中间的contentTable是不是就没被引号包围住呀。
像这种，引号里面还要使用引号的，应该使用单双引号进行区分，像这里，你id="contentTable"用了双引号了，你外层就用但引号。

'//*[@id="contentTable"]/tbody'
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

学习爬虫遇到问题，请各位提供思路爬虫
2022-07-15 15:18

回答 2 已采纳你看这："//[@id="contentTable"]/tbody" ，你这里是不是有4个双引号，从左往右开始，第一个双引号找离它最近的一个双引号配成一对。"//[@id=""]/tbody"也是一队
学习用seleium学习爬虫时遇到的问题 python selenium 有问必答爬虫
2022-07-17 22:19

回答 2 已采纳页面初始就是只有5个class是_qlq27g的div之后是用js动态更新到20个的用time.sleep(5)延时一下,等到js动态更新后再获取即可你题目的解答代码如下： from selenium
seleium学习爬虫技术遇到的问题 python selenium 有问必答爬虫
2022-07-08 23:33

回答 3 已采纳你"iframe[title=’livere‘]"中单引号(')写成了中文全角的，要改成英文半角的。并且你页面中没有title='livere'的iframe只有title='livere-comme
爬虫思路
2021-04-05 23:16

喜欢玩游戏的大尾巴狼的博客 java爬虫认识爬虫数据采集的思路。爬虫什么时候用如何爬爬虫的注意点结语认识爬虫注：这篇博客是的爬虫是用的java编写的。python的，我虽然有开始接触py，但是目前还没用对py的爬虫进行研究。不过爬虫的基本原理都...
python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
python爬虫学习中遇到的问题 python 爬虫
2023-02-14 11:17

回答 4 已采纳该回答引用ChatGPT根据错误信息，这个问题可能是由于连接超时或网络连接不可用导致的。因此，建议您检查以下几个方面：确保您的网络连接正常并且能够访问请求的地址。确保请求的地址正确且存在，尝试在浏览
关于xpath爬虫遇到的问题 python 其他爬虫
2023-03-13 17:09

回答 5 已采纳 titles=html.xpath('//*[@class="title"]/a//text()') abstracts=html.xpath('//*[@class="abstract"]') r
2024年Python最新关于反爬虫我见到的各种前后端奇葩姿势_爬虫前端后端(1)
2024-05-01 11:16

2401_84689394的博客硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津...网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。
爬虫遇到问题（POST请求） python 爬虫
2021-08-08 17:22

回答 2 已采纳你可以调用百度的api，我以前用过，只用输入你要说的话，然后对应一个字典设置你的账户秘钥和语音要求，就会自动上传网站生成可以参考这个 https://blog.csdn.net/prajna00
Python院士爬虫遇到了问题 python 爬虫
2022-06-12 23:13

回答 1 已采纳 except后面可以加 e，然后打印e。类似 except Exception as e: print("未知异常：%s" % e) 另外，你这样创建启动进程，似乎有点多。最
爬虫爬网站遇到编码器问题 python 爬虫
2023-01-19 16:14

回答 4 已采纳成功了，加这一句
【java】 java开发中常遇到的各种难点思路方案
2023-03-10 11:54

孟秋与你的博客作为一个开发人员总会遇到各种难题本文列举博主遇见/想到的例子，也希望同学们可以在评论区举例交流共同进步~
用python做爬虫遇到的问题 python 爬虫
2021-09-11 14:26

回答 2 已采纳
Python - 爬虫_Ajax的请求方式
2021-11-29 20:57

shunshunss的博客 post 请求，必须要编码各位路过的朋友，如果觉得可以学到些什么的话，点个赞再走吧，欢迎各位路过的大佬评论，指正错误，也欢迎有问题的小伙伴评论留言，私信。每个小伙伴的关注都是本人更新博客的动力！！！
机器学习系列(7)_机器学习路线图(附资料)
2016-02-28 11:55

龙心尘的博客也许你和这个叫『机器学习』的家伙一点也不熟，但是你举起iphone手机拍照的时候，早已习惯它帮你框出人脸；也自然而言点开今日头条推给你的新闻；也习惯逛淘宝点了找相似之后货比三家；亦或喜闻乐见微软的年龄识别...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月15日

悬赏问题

¥15 c语言怎么用printf（“\b \b”）与getch（）实现黑框里写入与删除？
¥20 怎么用dlib库的算法识别小麦病虫害
¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
¥15 java写代码遇到问题，求帮助
¥15 uniapp uview http 如何实现统一的请求异常信息提示？
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？

学习爬虫遇到问题，请各位提供思路

我想要达到的结果

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新