爬虫部分数据写入excel失败

最近学习爬虫，参考大佬代码，但是爬取结果没有抬头，第三个爬取的数据并没有插入excel中

import requests
from lxml import etree
from openpyxl import Workbook
import random

class tengxun():
    def __int__(self):
        self.url = 'https://ke.qq.com/course/list?mt=1001&page={}'
        self.header = {
            "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0",
            "Connection": "keep - alive",
        }
        self.wb = Workbook()
        self.ws = self.wb.active
        self.ws.append(['title', 'link', 'now_reader'])

    def geturl(self):
        self.url = 'https://ke.qq.com/course/list?mt=1001&page={}'
        url = [self.url.format(i) for i in range(1,5)]
        return url

    def prase_url(self,url):
        self.header = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0",
            "Connection": "keep - alive",
        }
        response = requests.get(url, headers=self.header, timeout=5)
        return response.content.decode('gbk', 'ignore')

    def get_list(self,html_str):
        html = etree.HTML(html_str)
        connect_list = []
        lists = html.xpath("//li[@class ='course-card-item']")
        for list in lists:
             item = {}
             item['title'] = ''.join(list.xpath("./h4/a[@class = 'item-tt-link']/text()"))
             item['link'] = ''.join(list.xpath("./a[@class = 'item-img-link']/@href"))
             item['now_reader'] = ''.join(list.xpath("./div[@class = 'item-line item-line--moddle']/span[@class='line-cell item-user']/text()"))
             connect_list.append(item)
        return connect_list

    def save_list(self, connects):
        self.wb = Workbook()

        self.ws = self.wb.active

        for connect in connects:
            self.ws.append([connect['title'], connect['link'], connect['now_reader']])
        print('保存成功页招聘信息')

    def run(self):
        url_list = self.geturl()
        for url in url_list:
            html_url = self.prase_url(url)
            connects = self.get_list(html_url)
            self.save_list(connects)
        self.wb.save(r'C:\Users\Administrator\Desktop\resource\UA_ls\demo_09 try.xlsx')

if __name__=='__main__':
    spider = tengxun()
    spider.run()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小黑LLB 2019-07-15 18:20
关注
item-line item-line--moddle => item-line item-line--middle
但是数据还是不全，我也没办法了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫数据与网页不一致 python 爬虫
2022-08-16 16:50

回答 2 已采纳 rows是行数，你改成10000，一次性爬完，不用翻页。
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
爬虫爬出的数据，print输出可以全部输出，但是写入CSV文件时只能写最后一行 python 爬虫
2022-02-22 08:10

回答 3 已采纳 # -*- coding:utf-8 -*- import requests import csv,re url1 = 'http://category.dangdang.com/' url2
python爬虫数据写入excel_Python学习一: 使用Python爬取网页数据,并写入Excel文件
2020-11-30 11:09

weixin_39606799的博客自学Python的时候,在网上看见一篇比较简单的爬虫小...第一部分:根据URL进行数据的爬取# -*-coding:utf-8-*-import urllib2import sysfrom bs4 import BeautifulSoup# 写入Excel表需要使用的库from openpyxl import W...
在写爬虫运用xlwt库将网页信息写入execl中遇到的问题 python 爬虫
2022-04-16 15:54

回答 1 已采纳你抓回来的数据比如name,是这样的[name,],不是字符串就是个列表，你把列表再往表格里写，当然写不进去，你爬下来的比如name之类用join都给变成单个字符串，就能写进去了
如何用pycharm爬去新闻，并将含有指定关键词的新闻标题及页面链接写入Excel文件中，将其保存到桌面上？(语言-python) pycharm python 爬虫
2023-02-21 16:44

回答 1 已采纳百度首页本来就没有python关键字！！！
Python爬虫# 将url携带的参数写成循环代入，如何将每次不同参数爬取到的结果依次保存到同一张excel python 有问必答爬虫
2022-01-30 21:37

回答 2 已采纳你题目的解答代码如下： import requests from lxml import etree import xlwt urls = ('9787501586387', '9787501586
python将字符写入excel_Python 爬虫并且将数据写入Excel
2020-12-16 14:34

weixin_39663970的博客今天这里展示了一个简单的爬虫程序，并且对数据进行读取分析，最后写入Excel文件。难点在于分析HTML代码上，最起码您得看得懂HTML代码。requests库requests库功能很强大，这里我们需要用到它都只是我们给它一个网址...
html文件的读取并输出到excel表中 python 爬虫
2021-08-02 09:31

回答 2 已采纳先抓下来，然后按需要写入你的excel表就可以了啊，难得不是写入，是抓取吧
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
练习用pandas获取网页表格数据并保存至excel中遇到问题 python 爬虫
2022-10-02 17:54

回答 1 已采纳这篇文章：Pandas如何读取保存Excel 也许能够解决你的问题，你可以看下
python爬虫数据写入excel
2023-03-14 15:11

agrapea的博客在Jmeter118中描述了如何将接口请求的响应数据写入到csv中，同样的接口如果采用python写法，会简便很多，主要是用到了python中的pandas库。'2023展会.xlsx''参展公司中文名称'
爬取有结果，但是导出excel文件是空的 python 其他
2021-03-12 02:16

回答 2 已采纳直接答案：在函数 `news_ershoufang` 最后一行返回下数据 `return data_all`修改下excel的列名，一共两列 `df.columns = ['城市', '房屋户型'
py爬虫数据到本地Excel表格
2022-10-31 14:39

MrFlySand_飞沙的博客程序目的：根据公众号文章中的内容，爬取文章的标题、发布时间、责任人署名、文章链接，将这个python程序打包成为exe文件，在运行exe文件时可以爬取html的内容并保存为本地的Excel表格。所含有的知识点 requests...
我是如何把python爬虫获取到的数据写入Excel的？
2021-08-18 08:57

途途途途的博客如何将爬虫获取的数据写入Excel，这一点我在爬虫文章几乎都是采用这种方式来进行操作的写入Excel的目的是为了后续更加方便的使用pandas对数据进行清洗、筛选、过滤等操作。为进一步数据研究、可视化打基础。 ...
没有解决我的问题, 去提问

悬赏问题

¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料