请求各位大神指出下面一段python爬虫代码的问题：

我想在24365官网上爬取招聘信息中的岗位名称和公司名称到EXCEL表格中，但运行代码后表格里只有标题，没有内容，要爬取的网站如图所示：

图片说明

网址：https://job.ncss.cn/student/jobs/index.html?server=true&jobName=%E5%AE%89%E5%85%A8&areaCode=&degreeCode=&monthPay=&areasName=%E5%85%A8%E5%9B%BD
代码如下：

import urllib.request,traceback

import re
import xlwt #用来创建excel文档并写入数据

def get_content(page):

 url = 'https://job.ncss.cn/student/jobs/index.html?server=true&jobName=%E5%AE%89%E5%85%A8&areaCode=&degreeCode=&monthPay=&areasName=%E5%85%A8%E5%9B%BD'+str(page)+'.html'
a = urllib.request.urlopen(url)#打开网址
html = a.read().decode('utf-8')#读取源代码并转为unicode
return html

def get(html):

        reg = re.compile(r'class="company-name" .*?>(.*?)</span>.*?<span>(.*?)</span>',re.S)#匹配换行符,设置正则表达式
    items = re.findall(reg,html)
    return items

def excel_write(items,index):
#爬取到的内容写入excel表格
for item in items:#职位信息
for i in range(0,2):
#print item[i]
ws.write(index,i,item[i])#行，列，数据
print(index)
index+=1
newTable="test2.xls"#表格名称

wb = xlwt.Workbook(encoding='utf-8')#创建excel文件，声明编码

ws = wb.add_sheet('sheet1')#创建表格

headData = ['公司','类型']#表头部信息

for colnum in range(0,2):

    ws.write(0, colnum, headData[colnum], xlwt.easyxf('font: bold on'))  # 行，列

for each in range(1,10):

    index=(each-1)*50+1
excel_write(get(get_content(each)),index)

wb.save(newTable)

该网站爬取内容所需的审查元素在下图的蓝色位置：
图片说明

审查元素具体内容如下：
图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Italink 2020-03-25 20:43
关注
这个网页是动态加载的，你要获取内容，需要找到它获取内容的请求

使用requests库写了一个简单的代码，你也可以用requests库来写爬虫，比urllib简单太多了，我当初也是踩了urllib的坑，用pip安装一下就可以了

import requests url="https://job.ncss.cn/student/jobs/jobslist/ajax/" params={ "jobName": "安全", #搜索关键字 "offset": "1", #偏移，应该就是页码 "limit": "10", #每页的个数 } req=requests.get(url,params).json(); #这里得到一个解析json之后得到一个字典对象 for it in req['data']['list']: #可以先监视查看一下结构，输出即可 print(it);
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫的理解问题 chrome python selenium 爬虫
2018-02-23 03:04

回答 4 已采纳 1. 你的理解是对的 2. 我把我的理解说一下, 比如说一个网页显示了商品的价格, 而且这个价格信息是网页的js代码请求了价格信息对应的url之后显示出来的 - 我用requests库
python爬虫下载PDF失败 python 爬虫
2023-03-27 13:35

回答 3 已采纳感谢两位。我刚刚分析了一下所有下载异常的文件，名字中都有冒号：，replace替换后现在可以下载了。
Python爬虫解码的问题？ python 有问必答
2021-09-11 15:07

回答 2 已采纳在获得响应后，使用response.encoding=response.apparent_encoding识别网页编码即可，示例： from bs4 import BeautifulSoup from
python爬虫入门教程–优雅的HTTP库requests（二）
2020-12-25 04:11

好在，还有一个非常惊艳的 HTTP 库叫 requests，它是 GitHUb 关注数最多的 Python 项目之一，requests 的作者是 Kenneth Reitz 大神。 requests 实现了 HTTP 协议中绝大部分功能，它提供的功能包括 Keep-Alive、连接...
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 08:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
爬虫python 中国新闻网搜索引擎无法请求 python 有问必答
2021-12-23 10:17

回答 1 已采纳 headers缺少了cookie，这个网址通过js生成这__jsluid_h，__jsl_clearance这2个cookie，没有的话会输出js生成cookie然后再跳转到搜索结果页示例代码如下
python多线程爬虫如何在中断后继续上次的断点下载数据 python sql 数据挖掘
2021-06-03 15:53

回答 3 已采纳 redis记没成功的不就完事了，带同步访问，doge
python编写爬虫小程序
2021-01-03 07:25

想到廖雪峰大神的python教程很经典、很著名。就想找找有木有pdf版的下载，结果居然没找到！！CSDN有个不完整的还骗走了我一个积分！！尼玛！！怒了，准备写个程序直接去爬廖雪峰的教程，然后再html转成电子书。 ...
请教大神，一个爬虫问题 python
2019-09-20 13:36

回答 3 已采纳解决方法：通过浏览器查看登录状态的cookie信息，假设为 Cookie: a=b,c=d 然后在gethtmltext 函数的请求头 kv中添加键值对，也就是在kv那行的下面添加 kv['Coo
python 爬虫XHR获取失败 python 爬虫
2017-10-22 15:00

回答 2 已采纳你要用post去请求，我使用的是request库 import requests url = 'http://www.bjbus.com/home/ajax_news_list.php' hea
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
Python爬虫以及数据可视化分析
2020-12-25 17:43

反卷三明治的博客 Python爬虫以及数据可视化分析之B站动漫排行榜信息爬取分析 ...简单几步，通过Python对B站...PS: 作为Python爬虫初学者，如有不正确的地方，望各路大神不吝赐教[抱拳] 本项目将会对B站番剧排行的数据进行网页信息爬取以及
Python爬虫常用的语法怎么解释更好理解？ python
2021-08-19 15:33

回答 3 已采纳奥秘指的是什么奥秘？代码没有什么捷径可言，唯多看多敲。我看你是不是学习顺序搞反了，想学爬虫，你得先了解你要爬的是个什么东西吧，先学html的基本语法，顺便了解下jquery的选择器，再来写爬虫应该会容
使用requests库制作Python爬虫
2021-01-20 04:45

使用python爬虫其实就是方便，它会有各种工具类供你来使用，很方便。Java不可以吗？也可以，使用httpclient工具、还有一个大神写的webmagic框架，这些都可以实现爬虫，只不过python集成工具库，使用几行爬取，而Java...
影视信息检索网站（python爬虫+django网站搭建）
2020-11-21 12:14

大一小学期布置的大作业（一直鸽到现在才把最后一个大作业发出来），要求首先利用爬虫爬取影视信息，然后用django搭建一个检索网站。由于时间因素（小学期考完一天速成大作业），很多细节以及美观部分做得还欠佳，...
没有解决我的问题, 去提问

悬赏问题

¥15 Python爬取指定微博话题下的内容，保存为txt
¥15 vue2登录调用后端接口如何实现
¥65 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？

请求各位大神指出下面一段python爬虫代码的问题：

2条回答 默认 最新

悬赏问题

2条回答默认最新