爬虫猪八戒遇到的疑惑，求佬解答

我在爬取猪八戒网站时候。text一直返回的是空集，这是为什么呀？


import requests
from lxml import etree
import time
import random
url = "https://www.zbj.com/fw/?k=爬虫"
resp = requests.get(url)
resp_text = resp.text
etree = etree.HTML(resp_text)
divs = etree.xpath('//*[@id="__layout"]/div/div[3]/div[1]/div[4]/div/div[2]/div/div[2]/div')
for div in divs:
    price = div.xpath('./div/div[3]/div[1]/span/text()')[0].strip("¥")
    if not price:
        continue
    company = div.xpath('./div/div[5]/div[1]/div[1]/div/text()')[0]
    text = div.xpath('../div/div[3]/div[2]/div/span//text()')
    print(company, price, text)
    time.sleep(random.uniform(1, 3))

八戒软件开发服务 880 []
畅序丨包售后按需定制满意付款 100 []

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
独角鲸网络安全实验室 2025-12-17 11:01
关注
核心就俩问题，超好解决：

页面是JS动态加载的！requests只能抓静态源码，你要的text内容是加载后才生成的，resp.text里根本没有，xpath自然捞空；
xpath路径错了，../回退层级容易乱，手写路径大概率对不上。

解决步骤：
① 先加个请求头伪装浏览器（防反爬+基础准备）：

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"} resp = requests.get(url, headers=headers)

② 换Playwright/Pyppeteer爬动态页面（必做！），这俩能模拟浏览器加载JS，拿到完整页面；
③ xpath别手写了：浏览器F12→Elements里找到目标text元素→右键→Copy Xpath，直接用复制的路径。

按这三步来，包准能拿到text内容～
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar
2022-05-01 09:47

（含源码及报告）本程序分析了自2016年到2021年（外加）每年我国原油加工的产量，并且分析了2020年全国各地区原油加工量等，含饼状图，柱状图，折线图，数据在地图上显示。运行本程序需要requests、bs4、csv、pandas...
爬虫为什么常用Python语言？
2024-06-29 11:23

凯森森讲Python的博客其实不同的编程语言都可以写爬虫，只是有些语言更适合于某些场合和目的。在这篇文章中，从性能、难度、功能、风险等方面来比较几种常见的编程语言在写爬虫方面的优缺点，并且给出我的建议和看法。在探讨为什么爬虫非...
【Go语言爬虫】为什么要用Go语言写爬虫？
2025-11-05 19:32

数据知道的博客 Go爬虫的核心优势，总结概述如下：极致并发：Goroutines和Channels提供了无与伦比的并发性能和编程模型。高性能：编译型语言，运行速度快，内存占用低。部署简单：编译成无依赖的二进制文件，跨平台部署极其方便...
让AI替你写爬虫：基于自然语言的 AI Scraper Studio 实战解析
2025-12-09 10:17

陈老老老板的博客 AI Scraper Studio通过AI驱动的自然语言交互技术，解决了传统数据采集的开发成本高、反爬应对弱、扩展效率低等痛点。用户只需输入目标URL和需求描述，系统即可自动生成爬虫脚本，并提供自愈能力应对网站变化。操作...
【8大编程语言的适用领域】先别着急选语言学编程，先看它们能干嘛
2022-02-24 09:28

退休的龙叔的博客你学的编程语言真的是你想要的吗
学1个月爬虫就月赚6000？别被骗了，老师傅告诉你爬虫的真实情况
2021-08-01 17:53

退休的龙叔的博客爬虫的四个水平，你在哪一个层次？巅峰爬虫是什么样子？
爬虫逆向：逆向中用到汇编语言详细总结
2025-03-17 19:12

数据知道的博客汇编语言作为低级编程语言，直接对应于机器指令，能够帮助逆向工程师深入理解程序的执行流程和逻辑。本文将详细总结在爬虫逆向过程中常用的汇编语言知识，包括基本概念、常用指令、寄存器、调用约定以及分析工具等。
全网最全python爬虫精进
2021-04-25 17:33

yk 坤帝的博客因为这些数据是用计算机的语言写的，浏览器还要把这些数据翻译成我们能看得懂的内容；（2）提取数据：我们就可以在拿到的数据中，挑选出对我们有用的数据；（3）存储数据：将挑选出来的有用数据保存在某一文件/...
使用Python爬虫会遇到的问题和解决方法（包含案例）
2024-05-01 22:42

svygh123的博客一、HTTP错误（如403 Forbidden）二、反爬虫机制（如验证码、动态加载数据）三、网络延迟或不稳定
2025最新常用编程语言支持的爬虫库总结大全（含实战与代理推荐）
2025-10-31 17:33

猫头虎的博客本文总结了2025年主流编程语言(Python/Java/Go/C#/Node.js/Ruby/PHP)支持的爬虫库，重点分析了实际开发中的IP代理解决方案。针对不同场景(数据采集/SEO监控/跨境电商等)提供了代理策略建议，并推荐使用企业级动态IP...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月16日

爬虫猪八戒遇到的疑惑，求佬解答

1条回答 默认 最新

问题事件

1条回答默认最新