越界E 2022-06-17 19:59 采纳率: 0%
浏览 30

xpath用for循环为什么只拿到一条数据?

我想知道为什么我这个只能抓一条数据

mport scrapy

class textSpider(scrapy.Spider):
name = 'textone'
#allowed_domains = ['www.ctrp.com']
start_urls = ['https://you.ctrip.com/sight/jiuzhaigou25/77380.html']

def parse(self, response, *args, **kwargs):
    div_list = response.xpath('.//div[@id="commentModule"]/div[5]')
    for div in div_list:
        # xpath返回的列表,但是列表元素一定是selector类型对象
        # extract可以将selector对象中的data参数储存的字符串提取出来
        # 列表调用了extract之后,则表示将列表中每一个selector对象中的data对应的字符串提取出来
        content = div.xpath('./div[1]/div[2]/div[2]/text()').extract_first()
        #  // *[ @ id = "commentModule"] / div[5] / div[1] / div[2] / div[2]
        time = div.xpath('./div[1]/div[2]/div[4]/div[1]/text()').extract_first()
        content = ''.join(content)
        time = ''.join(time)

        print(content, time)

img

  • 写回答

1条回答 默认 最新

  • 「已注销」 2022-06-17 20:16
    关注

    打断点调试就明白了

    评论

报告相同问题?

问题事件

  • 创建了问题 6月17日

悬赏问题

  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决
  • ¥50 树莓派安卓APK系统签名
  • ¥65 汇编语言除法溢出问题