zhushu4685 2017-10-12 09:42 采纳率: 0%
浏览 632

python3的srcapy百度知道中的数据为什么显示不出来

我的代码

 # -*- coding:utf-8 -*-
from scrapy.spiders import  CrawlSpider
from scrapy.selector import Selector

class TestSrc(CrawlSpider):
    name = "testSrcapy"
    start_urls = ['https://zhidao.baidu.com/question/1993068880203051627.html']

    def parse(self, response):
        selector = Selector(response)
        UrlData = selector.xpath('//html/body/div[7]/div/section/article/div[1]/h1/span/text()').extract()
        print(UrlData)

settings.py已经设置了USER_AGENT 和 ROBOTSTXT_OBEY
我只想把标题的文本尝试打印出来。也试过其他网站也不行(教程的豆瓣却百试百灵)
xpath路径是firefox中复制下来的

  • 写回答

1条回答 默认 最新

  • 星期墨 2017-10-15 14:26
    关注

    可以用python+selenium

    评论

报告相同问题?

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料