lluwwei 2020-04-17 21:43 采纳率: 0%
浏览 578

用python爬取智联招聘,用xpath匹配页面上想要爬取的信息,已经成功,但是返回值却是一个空列表,是为什么?

疑问:我想要爬取智联招聘上面一个二级页面的招聘信息,用xpath匹配该html的时候,能够出现该信息,但是代码中却是出现空列表

该二级页面url : 'https://jobs.zhaopin.com/CC196911813J00181501315.html'

匹配的xpath: '//button[@class="company__industry"]/text()'

import requests
from lxml import etree
import time
import csv
import random

job_list = []

def get_page(url):

    begin = time.time()

    ua_list = [
     'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'          
        ]
    headers = {'User-Agent':random.choice(ua_list)}

    html = requests.get(url=url,headers=headers).content.decode('utf-8')
    time.sleep(random.randint(1,2))

    parse_html = etree.HTML(html)

    # xpath来匹配
    industry = parse_html.xpath('//button[@class="company__industry"]/text()')
    job_list.append(industry)

    print(job_list)

    finish = time.time()
    print('执行时间为:%2f' % (finish-begin))

# 该页面的url为 ”https://jobs.zhaopin.com/CC196911813J00181501315.html“    
get_page('https://jobs.zhaopin.com/CC196911813J00181501315.html')
  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 17:39
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!