cxfxynpy 2023-03-09 00:19 采纳率: 44.4%
浏览 22
已结题

搞半天获取不到数据,搞几天了,不知道是哪里出问题了



import requests
from lxml import etree
import lxml
from bs4 import BeautifulSoup


url = 'https://apic.liepin.com/api/com.liepin.searchfront4c.pc-search-job'
head = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36',
    'X-Client-Type': 'web',
    'X-Fscp-Bi-Stat': '{"location": "https://www.liepin.com/zhaopin/?city=410&dq=410&pubTime=¤tPage=2&pageSize=40&key=python&suggestTag=&workYearCode=0&compId=&compName=&compTag=&industry=&salary=&jobKind=&compScale=&compKind=&compStage=&eduLevel=&scene=page&suggestId="}',
    'X-Fscp-Std-Info': '{"client_id": "40108"}',
    'X-Fscp-Trace-Id': '3dd1e997-a976-40ca-a2dc-1341c3a936f8',
    'X-Fscp-Version': '1.1',
    'X-Requested-With': 'XMLHttpRequest',
    # 'X-XSRF-TOKEN': 'akNB8zNITCySkUDudNhWog',
}
# 0, 1, 2, 3, 4

data = {"data": {
    "mainSearchPcConditionForm": {"city": "410", "dq": "410", "pubTime": "", "currentPage": "3", "pageSize": 40,
                                  "key": "python", "suggestTag": "", "workYearCode": "0", "compId": "", "compName": "",
                                  "compTag": "", "industry": "", "salary": "", "jobKind": "", "compScale": "",
                                  "compKind": "", "compStage": "", "eduLevel": ""},
    "passThroughForm": {"scene": "page", "ckId": "43a59xkh5vjfpt1qf4axal3q1l3scrqa"}}}
# 参考乌海市的案例
resp = requests.post(url, json=data, headers=head)  # post——携带data参数
div = resp.content.decode('utf-8')

tree = etree.HTML(div)
print(tree)
lis_ = tree.xpath('//div[@class="job-list-box"]')
print(lis_)
  • 写回答

2条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-03-09 06:00
    关注

    你的 div 是一个 json 数据啊,为什么用 lxml

    在你的 div 后边加一句

    
    div = resp.content.decode('utf-8')
    j = json.loads(div)
    for item in j['data']['data']['jobCardList']:
        print(item)
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月18日
  • 已采纳回答 3月10日
  • 创建了问题 3月9日

悬赏问题

  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?