scrapy每个url提取的数据保存不同的表中，几百个url？

scrapy每个url提取的数据保存mongobd不同的集合zhong，几百个url？
各位大佬怎么处理帮帮忙！不知道怎么处理

# -*- coding: utf-8 -*-
import scrapy
from dongQiuDi.items import  DongqiudiItem
import  time

class ZuqiuSpider(scrapy.Spider):
    name = 'zuqiu'
    allowed_domains = ['dongqiudi.com']
    start_urls = [
        "https://www.dongqiudi.com/data/1",
        'https://www.dongqiudi.com/data/2',
        "https://www.dongqiudi.com/data/3",
        "https://www.dongqiudi.com/data/4",
        "https://www.dongqiudi.com/data/5",
        "https://www.dongqiudi.com/data/10",
        "https://www.dongqiudi.com/data/16",
        "https://www.dongqiudi.com/data/12",
        "https://www.dongqiudi.com/data/16",
        "https://www.dongqiudi.com/data/19",        #土超
        "https://www.dongqiudi.com/data/55",
        "https://www.dongqiudi.com/data/17",
        "https://www.dongqiudi.com/data/18",
        "https://www.dongqiudi.com/data/20",        #巴西
        "https://www.dongqiudi.com/data/21",        #阿根廷
        "https://www.dongqiudi.com/data/68",        #卡特尔
        "https://www.dongqiudi.com/data/69",        #伊朗
        "https://www.dongqiudi.com/data/71",        #乌兹别克
    ]

    def parse(self, response):
        p_list = response.xpath(".//div[@class='team_point_ranking']/div/div/div/p")
        for p in p_list:

            item = DongqiudiItem()

            item['No'] = p.xpath(
                "./span[1]/text()").extract_first()
            item['image'] = p.xpath(
                "./span[2]/img/@src").extract_first()
            item['name'] = p.xpath(
                "./span[2]/b/text()").extract_first()

            item['sestion'] = p.xpath(
                "./span[3]/text()").extract_first()
            item['win'] = p.xpath(
                "./span[4]/text()").extract_first()
            item['mean'] = p.xpath(
                "./span[5]/text()").extract_first()
            item['lose'] = p.xpath(
                "./span[6]/text()").extract_first()
            item['coal'] = p.xpath(
                "./span[7]/text()").extract_first()
            item['fumbole'] = p.xpath(
                "./span[8]/text()").extract_first()
            item['goaldifference'] = p.xpath(
                "./span[9]/text()").extract_first()
            item['score'] = p.xpath(
                "./span[10]/text()").extract_first()
            yield  item

        time.sleep(1)          #每一个URL，暂停一秒

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
放风喽 2020-03-05 11:07
关注
item设置一个key，value是response.url
在peplines里面将这个key取出来，创建一个表，就行了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

怎么解决Python中scrapy导入出错的问题？ pycharm python
2021-07-14 22:31

回答 1 已采纳看提示是说没有 crawl 命令，要解决这个问题，需要确保2点： 1.把爬虫.py复制到spiders文件夹里如执行scrapy crawl demo ,spiders里面就要有demo.py文件
scrapy怎么没打印数据？ python
2021-07-21 12:31

回答 3 已采纳 allowed_domains = ["jobui.com"] 好像是不要WWW 或者这个直接不写 allowed_domains = ["jobui.com"]
关于#pythonscrapy#的问题，如何解决？ python 开发语言爬虫
2023-04-02 16:26

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
Python爬虫之scrapy框架介绍
2022-11-28 19:35

代码输入中...的博客 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）的具有很强通用性的项目模板。对于...
python爬虫scrapy python 有问必答
2021-07-22 10:03

回答 2 已采纳看下数据是否是动态加载的，多抓几次包，分析下；可能需要通过添加page参数，进行爬取！
在 python scrapy爬虫框架：response.xpath（）的返回值是[ ],这个怎么解决？ python
2020-07-03 11:16

回答 4 已采纳考虑网页的内容使用了ajax，使用右键-》查看网页源代码，看是否仍然能获得指定的内容
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
Python爬虫——scrapy框架介绍
2022-11-29 13:38

秃头雨雨的博客 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）的具有很强通用性的项目模板。对于...
scrapy中把数据存储到MongoDB，运行也没出错怎么查找不到数据库呢？？？ mongodb python
2020-06-05 16:06

回答 1 已采纳 1.密码设置了吗 2.127.0.0.1改成localhost试试 3.我没招了
Python的Scrapy模块；解释一下？ javascript pycharm python
2021-07-23 11:36

回答 3 已采纳这个只是爬虫的Spider编写啥也没做没有入口都运行不了顶多实现下面:import requestsurl = 'https://www.santostang.com/'response = re
利用scrapy如何爬取图表中的数据 python 其他有问必答
2021-07-07 23:48

回答 1 已采纳 scrapy得出的响应内容是在network的doc里面，如图如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
2023-01-10 17:18

biaobro的博客爬虫与反爬虫 - 2023最新爬取某天气网站历史数据 - JS逆向 - Python实现
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
Scrapy 案例一：通过 API 抓取天气预报数据
2022-09-13 03:56

Amo Xiang的博客 Scrapy 案例：通过 API 抓取天气预报数据
Python爬虫框架Scrapy入门
2018-01-26 14:44

langshanglibie的博客 Python爬虫框架Scrapy入门一、爬虫定义网络爬虫（Web crawler），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

scrapy每个url提取的数据保存不同的表中，几百个url？

1条回答 默认 最新

悬赏问题

1条回答默认最新