问一下各位,为什么使用Python爬虫采集不到数据?谢谢各位
import requests
from lxml import etree
import csv
#构造url地址
url = "https://www.zhipin.com/web/geek/job?query=%E5%A4%A7%E6%95%B0%E6%8D%AE&city=100010000&page={}"
#构造请求头信息
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0"
}
#创建一个csv文件
f = open('sccc.csv', mode ='w', newline ='', encoding = 'utf-8')
fieldnames = ['职位', '工作地点', '薪资', '工作经验', '学历', '公司名称', '公司信息', '技术需求', '福利待遇']
#创建write对象
write = csv.DictWriter(f, fieldnames=fieldnames)
write.writeheader()
#实现翻页功能
for i in range(1,11):
resp = requests.get(url=url.format(i), headers=headers)
resp.encoding = "utf-8"
# print(resp.text)
html = etree.HTML(resp.text)#构造结构化的对象,方便解析使用
jobs = html.xpath("/html/body/div[1]/div[2]/div[2]/div/div[1]/div[2]/ul")
#print(jobs)
for job in jobs:
item={}#创建item字典去保存数据
job_name = job.xpath("./li/div[1]/a/div[1]/span[1]/text()")
item['name'] = job_name[0].strip() if job_name else None
print(job_name)
print(item)
#写入csv文件
write.writerow(item)
这个是输出的结果
csv文件里是这样的