为何pyspider运行成功后Results为空？

from pyspider.libs.base_handler import *

import re

class Handler(BaseHandler):
crawl_config = {
}

def __init__(self):
    self.urls=[
     "www.wego.cn/airports/airport-name/a",
     "www.wego.cn/airports/airport-name/b",
     "www.wego.cn/airports/airport-name/c",
     "www.wego.cn/airports/airport-name/d",
     "www.wego.cn/airports/airport-name/e",
    ]

@every(minutes=24*60)
def on_start(self):
    for url in self.urls:
        self.crawl(url, callback=self.index_page,validate_cert=False)

@config(age=10*24*60*60)
def index_page(self, response):
    url_list=re.findall('<li\sclass="extra-item\sis-hidden">\s+<a\shref="([\s+\S+]*?)">          \s+\S+',response.text)
    for item in url_list:
        url="http://www.wego.cn"+item
        self.crawl(url,callback=self.detail_page,validate_cert=False)

@config(priority=2)
def detail_page(self, response):
    print("------enter matching--------")
    AirportName=re.findall('<tr>\s+<td\swidth="200">全名</td>\s+<td>([\s+\S+]*?)</td>\s+</tr>',response.text)
    IATA=re.findall('<tr>\s+<td\swidth="200">IATA\s 代码</td>\s+<td>([\s+\S+]*?)</td>\s+</tr>',response.text)
    Latitude=re.findall('<tr>\s+<td\swidth="200">纬度</td>\s+<td>([\s+\S+]*?)</td>\s+</tr>',response.text)
    Longtitude=re.findall('<tr>\s+<td\swidth="200">经度</td>\s+<td>([\s+\S+]*?)</td>\s+</tr>',response.text)
    return {
        "url": response.url,
        "AirportName":AirportName[0] if AirportName else "无",
        "IATA":IATA[0] if IATA else "无",
        "Longtitude":Longtitude[0] if Longtitude else "无",
        "Latitude":Latitude[0] if Latitude else "无"
    }

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2020-05-25 14:50
关注
https://www.it1352.com/715358.html

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pyspider配置问题，无法运行，如何解决？(语言-python) python 有问必答
2022-04-08 15:19

回答 2 已采纳由于pyspider长期没有维护，许多模块导入方法已经改变，可尝试使用基于原库修改的新版本：https://pypi.org/project/pyspider3/
Python pyspider all运行出错 python 有问必答
2021-11-08 11:10

回答 2 已采纳可能是python版本的问题，可以试试低版本这问题在github有提及： PicklingError when input pyspider · Issue #950 ·
pyspider all运行正常，为啥还是打不开pyspider的ui界面 python 有问必答
2021-09-19 11:07

回答 1 已采纳在地址栏输入，不是百度。
python为什么没有run_python - pyspider run状态下result没有数据，而且没有继续向下执行，为什么？...
2020-12-04 22:07

weixin_39757265的博客问题抓取知乎首页的动态的url，...并且results中没有return的数据。def __init__(self):self.start_num = -1self.question_url=[]self.data = {"params":'{"offset":10,"start":-1}',"method":"next"}self.next_u...
python 爬虫 pyspider遇到的问题 python 爬虫
2017-12-08 09:03

回答 6 已采纳另外才注意到你现在的这个程序写的有问题的你在response里面写的请求? 应该是在请求的时候就将参数发过去的程序有问题啊 for循环要写在前面的on start 函数里面
Mac os big sur运行pyspider的时候报错 python 有问必答爬虫
2021-10-31 03:14

回答 2 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
VSCODE新建终端，为什么会直接运行source /home/luyx/bin/activate？ vscode
2023-01-25 11:09

回答 2 已采纳我直接把source /home/luyx/bin/activate中的activate文件给删了，就不会每次打开终端就会自动进入这个环境了
【Python技能树共建】pyspider框架的使用
2022-05-07 08:00

梦想橡皮擦的博客 pyspider 实战案例微医挂号网专家团队数据今天尝试使用一个新的爬虫库进行数据的爬取，这个库叫做pyspider，国人开发的，当然支持一下。...出现如下界面，代表运行成功，一般情况下，你的电脑如果没有安
pyspider支持用代理爬取https链接吗？ html5 unix 正则表达式
2021-02-26 11:08

回答 1 已采纳可以设置validate_cert=false，这样可以不验证证书 self.crawl('http://www.example.org/', validate_cert=False)
请问，pip的安装时的报错 python
2019-09-30 22:45

回答 1 已采纳你先安装下setuptools https://blog.csdn.net/qq_38880380/article/details/79734158
Python3 爬虫学习笔记 C17【爬虫框架 pyspider — 基本使用】
2019-09-15 23:00

IT.BOB的博客 title: Python3 爬虫学习笔记 C17 tags: 爬虫 pyspider categories: Python3 学习笔记 Python3 爬虫 thumbnail: https://cdn.jsdelivr.net/gh/TRHX/ImageHosting/ITRHX-PIC/thumbnail/spider.png avatar: ...
Python-爬虫框架Pyspider
2019-05-25 10:13

爬虫炫神的博客 Python-爬虫框架Pyspider PySpider：强大的网络爬虫系统，并自带有强大的webUI 1、框架特性 python 脚本控制，可以用任何你喜欢的html解析包（内置 pyquery） WEB 界面编写调试脚本，起停脚本，监控执行状态...
关于pyspider webui乱码/无法正常运行的解决方案
2022-04-08 22:19

aersang的博客今天第一天用pyspider，由于工作原因，需要在内网运行，在外网环境测试好（能正常运行且ui界面正常）将site-packages文件夹及Scripts文件夹移植到了内网主机，但是进入5000端口发现ui乱码，在网上寻求好久解决方案均...
[292]python爬虫-pyspider框架的使用
2018-07-10 08:50

周小董的博客 pyspider 是一个用python实现的功能强大的网络爬虫系统，能在浏览器界面上进行脚本的编写，功能的调度和爬取结果的实时查看，后端使用常用的数据库进行爬取结果的存储，还能定时设置任务与任务优先级等。本篇文章...
pyspider怎么删除项目
2018-11-10 21:48

Jonas_9的博客 pyspider创建项目后,发现并不能删除项目，而这些项目不用了需要删除该怎么办呢？ pyspider虽然没有设置删除的选项，但我们仍可以删除项目，以下是具体操作：将项目的组设为“delete",将状态调为”STOP"...
[Python3网络爬虫开发实战] pyspider 的基本使用
2019-12-07 17:57

xuange01的博客 pyspider 的基本使用本节用一个实例来讲解 pyspider 的基本用法。本节目标我们要爬取的目标是去哪儿网的旅游攻略，链接为 http://travel.qunar.com/travelbook/list.htm，我们要将所有攻略的作者、标题、出发...
Pyspider基本介绍
2020-08-14 17:15

破壳的小企鹅的博客 1、pyspider的架构 pyspider 的架构主要分为 Scheduler (调度器)、 Fetcher ( 抓取器)、 Processer (处理器) 三个部分,整个爬取过程受到 Monitor (监控器)的监控,抓取的结果被 Result Worker (结果处理器)处理 ...
Python爬虫-pyspider框架的使用
2018-07-18 17:02

北漠苍狼1746430162的博客 pyspider 是一个用python实现的功能强大的网络爬虫系统，能在浏览器界面上进行脚本的编写，功能的调度和爬取结果的实时查看，后端使用常用的数据库进行爬取结果的存储，还能定时设置任务与任务优先级等。...
pyspider抓取伯乐在线python相关所有文章
2018-11-12 20:29

Python成长路的博客英文官方文档（谷歌翻译后完全能看懂，不像python官方的，第三方库的都比较友好）伯乐在线python相关文章了解了requests和aiohttp之后，是时候学习一波框架了，而被吹的最厉害的莫过于scrapy和pyspider了。两个...
pyspider 安装和快速开始
2022-07-11 07:35

「已注销」的博客 From：官方文档 --- 快速开始：http://docs.pyspider.org/en/latest/Quickstart/ pyspider github 地址：https://github.com/binux/pyspider pyspider 官方文档：http://docs.pyspider.org/en/latest/ 爬虫框架 p...
没有解决我的问题, 去提问

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 HLs设计手写数字识别程序编译通不过
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向

为何pyspider运行成功后Results为空？

1条回答 默认 最新

悬赏问题

1条回答默认最新