陌陌有声 2020-04-04 20:57 采纳率: 0%
浏览 147

哪位大佬帮我找找语法问题,python新人,写了爬猎聘的代码

#爬取猎聘网信息
#!python 3.8
import requests,re
from lxml import etree

def gethtml(url):
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.69 Safari/537.36'}
r=requests.get(url,headers=header,timeout=30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
print(r.text)

&d_headId=5f0adc1c7d251bcead6fe5877c4df1c2&curPage=2
def paserPage(result,html):
net=etree.HTML(html)

urls=net.xpath('//div[@class="job-info"]/h3/a/@href')
job=net.xpath('//div[@class="job-info"]/h3/@title')
year=net.xpath('//div[@class="job-info"]/p[@class="condition clearfix"]/p/span[3]/text()')
company=net.xpath('//div[@class="company-info nohover"]/p[@class="company-name"]/a/@title')
        #print(company)
# print(job)
# print(company)
# print(year)
# print(urls)
for i in range(len(job)):
    result.append([job[i],year[i],company[i],urls[i]])
return result

def main(n):
#
#print(gethtml(url))
key='有色'
results=[]
for i in range(n):
urls='https://www.liepin.com/zhaopin/?isAnalysis=&dqs=&pubTime=&salary=&subIndustry=&industryType=&compscale=&key='+'key'+'&curPage='+str(i)
html=gethtml(urls)
lit=paserPage(results,html)
print(lit)

main(10)


  • 写回答

1条回答 默认 最新

  • 放风喽 2020-04-05 21:08
    关注

    连缩进都看不出来,怎么找茬啊

    评论

报告相同问题?

悬赏问题

  • ¥50 微信聊天记录备份到电脑提示成功了,但还是没同步到电脑微信
  • ¥15 python怎么在已有视频文件后添加新帧
  • ¥20 虚幻UE引擎如何让多个同一个蓝图的NPC执行一样的动画,
  • ¥15 fluent里模拟降膜反应的UDF编写
  • ¥15 MYSQL 多表拼接link
  • ¥15 关于某款2.13寸墨水屏的问题
  • ¥15 obsidian的中文层级自动编号
  • ¥15 同一个网口一个电脑连接有网,另一个电脑连接没网
  • ¥15 神经网络模型一直不能上GPU
  • ¥15 pyqt怎么把滑块和输入框相互绑定,求解决!