python3的srcapy百度知道中的数据为什么显示不出来

我的代码

 # -*- coding:utf-8 -*-
from scrapy.spiders import  CrawlSpider
from scrapy.selector import Selector

class TestSrc(CrawlSpider):
    name = "testSrcapy"
    start_urls = ['https://zhidao.baidu.com/question/1993068880203051627.html']

    def parse(self, response):
        selector = Selector(response)
        UrlData = selector.xpath('//html/body/div[7]/div/section/article/div[1]/h1/span/text()').extract()
        print(UrlData)

settings.py已经设置了USER_AGENT 和 ROBOTSTXT_OBEY
我只想把标题的文本尝试打印出来。也试过其他网站也不行(教程的豆瓣却百试百灵)
xpath路径是firefox中复制下来的

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星期墨 2017-10-15 14:26
关注
可以用python+selenium

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬取百度图片：手把手教你写一个图片爬虫
2025-07-26 21:05

Lyh1gguyg的博客通过分析JSON接口构造请求URL，从返回数据中提取图片地址，采用多线程并发下载提高效率。技术要点包括：请求参数构造、反爬策略（User-Agent模拟、请求间隔控制）、异常处理机制等。文章提供了完整的Python实现代码...
Python爬虫基础之 Scrapy
2023-11-20 11:25

向之所欣的博客注意：一般情况下不需要添加http协议，因为start urls的值是根据allowed domains修改的，所以添加了http的话，那么start urls就多了个http，还需要我们去手动删除。比如下载路径、下载的url和文件的校验码等。
Python爬虫之Scrapy（爬取csdn博客）
2020-12-21 00:17

Scrapy是一个强大的Python爬虫框架，它简化了网络爬虫的开发流程，使得开发者能够更加专注于数据抓取和处理。本教程将引导你如何使用Scrapy来爬取CSDN博客上的信息，包括博客标题、时间、链接以及内容摘要。 1. **...
python scrapy框架爬取网页页数多时，造成数据为空
2019-02-18 15:58

学编程的渣渣的博客在写爬虫时，发现一个问题（使用的时scrapy蜘蛛爬虫），获取某一个页面的数据时，使用css选择器，没有任何问题，... 百度原因，发现是因为scrapy中默认的页面请求速度与数据下载速度过快，造成服务器返回的数据为空...
Python多手段爬取百度图片Request+scrapy分别爬取，百度图片地址解密
2019-09-17 20:01

Sound_of_ Silence的博客好长一段时间没怎么碰爬虫，我估计得熟悉一下，要不然上手就遇到问题...这里我以风景图为关键词，输入后获得地址为‘https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&amp...
初探Scrapy爬虫框架之百度网页爬取
2020-06-04 15:26

爬虫&小白的博客三、百度网页爬取及保存流程 1、初始url的构造我们用浏览器打开百度搜索页面，输入关键字，这里我们输入“python”,可以看见url为https://www.baidu.com/baidu?wd=python&tn=monline_3_dg&ie=utf-8 不难看出wd参数...
python综合题_python综合题
2020-12-18 10:16

weixin_39628339的博客一、如何抛出异常并且捕获异常二、常用的Python标准库有哪些，并且说明其作用三、描述深拷贝和浅拷贝的区别四、__init__ 和 __new__的区别__new__ 会优先调用且有返回值__init__ 没有返回值五、什么是解释型语言，...
Python中的爬虫
2019-10-16 17:19

汁源大世界的博客 anaconda是一个集成环境（数据分析+机器学习）提供了一个叫做jupyter的可视化工具（基于浏览器） jupyter的基本使用快捷键：插入cell：a，b 删除：x 执行：shift+enter 切换cell的模式：y，m tab：自动补全打开...
python高级之scrapy框架
2018-10-08 10:41

xiaoxianerqq的博客目录： ...在编写爬虫时，性能的消耗主要在IO请求中，当单进程单线程模式下请求URL时必然会引起等待，从而使得请求整体变慢。 1、同步执行 1 import requests 2 3 def fetch_async...
Python爬虫框架Scrapy介绍加实战项目
2018-12-04 09:51

touch_your_heart的博客 Scrapy框架是异步处理框架,可配置和可扩展程度非常高,是Python中使用最广泛的爬虫框架，这个框架非常的强大，几乎能用来配合任何爬虫项目。项目要求：爬取腾讯招聘上的招聘信息（链接: link.）爬取数据要求：需要...
没有解决我的问题, 去提问

python3的srcapy百度知道中的数据为什么显示不出来

1条回答 默认 最新

1条回答默认最新