用python爬取智联招聘，用xpath匹配页面上想要爬取的信息，已经成功，但是返回值却是一个空列表，是为什么？

疑问：我想要爬取智联招聘上面一个二级页面的招聘信息，用xpath匹配该html的时候，能够出现该信息，但是代码中却是出现空列表

该二级页面url ： 'https://jobs.zhaopin.com/CC196911813J00181501315.html'

匹配的xpath: '//button[@class="company__industry"]/text()'

import requests
from lxml import etree
import time
import csv
import random

job_list = []

def get_page(url):

    begin = time.time()

    ua_list = [
     'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'          
        ]
    headers = {'User-Agent':random.choice(ua_list)}

    html = requests.get(url=url,headers=headers).content.decode('utf-8')
    time.sleep(random.randint(1,2))

    parse_html = etree.HTML(html)

    # xpath来匹配
    industry = parse_html.xpath('//button[@class="company__industry"]/text()')
    job_list.append(industry)

    print(job_list)

    finish = time.time()
    print('执行时间为：%2f' % (finish-begin))

# 该页面的url为 ”https://jobs.zhaopin.com/CC196911813J00181501315.html“    
get_page('https://jobs.zhaopin.com/CC196911813J00181501315.html')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 17:39
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
文章：python爬虫——xpath 爬取一本小说，初级爬虫入门。中也许有你想要的答案，请看下吧

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬取数据结果是一个空列表 python 爬虫
2022-11-23 10:22

回答 4 已采纳 import requests from lxml import etree url = 'https://nba.hupu.com/stats/players' headers = {'User
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python爬取房源，可以运行，但是每次只爬出一条是什么原因？ python
2022-09-22 19:36

回答 3 已采纳已修改，爬到不止一页，就是你信息提取包括了一些其他符号，自己再处理一下就好了 from lxml import etree import requests import csv import tim
python爬取智联招聘网_python爬取智联招聘工作岗位信息
2021-02-10 18:18

QualcommPolicy的博客 1 # coding:utf-82 # auth:xiaomozi3 #date:2018.4.194 #爬取智联招聘职位信息567 import urllib8 from lxml import etree9 import time10 import random11 import pdb1213 def downloader(kw,pages):14 '''下载器15...
Python爬虫 XPath 爬取的数据为空 python
2021-11-20 15:43

回答 2 已采纳
在使用Python中的XPath爬取路径时，想看看成功，却出现.content.decode("utf-8") python 大数据
2021-09-09 17:03

回答 1 已采纳你text获取一下文本，可以看看我置顶的那篇selenium文
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬取数据返回空列表_Python用xpath爬取数据返回空列表解决
2020-11-29 14:04

weixin_39918043的博客笔者以爬取2018年AAAI人工智能顶会论文元数据为例。其中包括标题(title)和摘要(abstract)等字段前言：首先需要查看该网页是否可以爬取，通过在URL后加入/robots,txt可以查看。①tbody问题笔者通过谷歌浏览器选取上图...
如何使用pycharm的requests爬取数据，用xpath进行解析的时候为空[？(语言-python) python 有问必答
2022-03-14 23:11

回答 3 已采纳你先输出一下request+s爬取的数据,看看是否有你需要爬取的内容你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
python 爬虫问题：如何按照指定顺序爬取想要获取的信息，使用那种规则可以做到？ python 有问必答
2021-09-14 19:14

回答 1 已采纳你爬取所有的P标签之后再把第一删除不就好了
关于python使用xpath爬取网页内容返回值为空列表的解决方法
2023-09-16 20:30

妄想...的博客在使用XPath爬取网站中遇到的写完代码发现运行后返回值为 [] 空列表解决方法： 1、首先看看你的这段代码中是否有 "tbody"存在，把"tbody"去掉 text=dom.xpath('/html/body/div[2]/div[3]/div[3]/table/tbody/tr[1...
从浏览器复制的xpath为什么打出来是个空列表 python 有问必答爬虫
2022-05-13 15:29

回答 2 已采纳积存金是用iframe加载的，在下面这个页面里面https://mybank.icbc.com.cn/icbc/newperbank/perbank3/gold/goldaccrual_query_o
python爬取数据返回空列表_Xpath在选择器中正确，在代码中返回的是空列表问题...
2020-11-29 14:04

weixin_39712865的博客一、问题：在进行爬虫的时候我们会用到xpath解析html文件，但是会有一种情况就是在xpath选择器中可以使用，但是在代码中就无法使用的情况。二、原因：1.是元素中有tbody的原因，这个元素是html生成时产生的，在使用...
python 使用xpath/lxml爬取网页表格并存CSV
2020-12-22 06:49

0x02 爬取代码 # -*- coding: utf-8 -*-# #------------------------------------------------------------------------------- # Name: test # Author: Negoowen # Date: 2020/3/9 __Author__ = 'Negoo_wen' #-----...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

用python爬取智联招聘，用xpath匹配页面上想要爬取的信息，已经成功，但是返回值却是一个空列表，是为什么？

疑问：我想要爬取智联招聘上面一个二级页面的招聘信息，用xpath匹配该html的时候，能够出现该信息，但是代码中却是出现空列表

该二级页面url ： 'https://jobs.zhaopin.com/CC196911813J00181501315.html'

匹配的xpath: '//button[@class="company__industry"]/text()'

1条回答 默认 最新

悬赏问题

1条回答默认最新