python爬虫运行问题

问题：代码运行后表格输出不了

# coding=gbk
# -*- coding:uft-8 -*-
# 微博搜索

import requests
from lxml import etree
import time
from urllib import parse
import pandas as pd


def collect(k, da):
    resLs = []
    for page in range(50):
        time.sleep(2)
        page += 1
        url = f'https://s.weibo.com/weibo?q={parse.quote(k)}&xsort=hot&suball=1×cope=custom:{da}&Refer=g&page={page}'
        print(url)
        print(k, da, page)
        headers = {
            'Cookie': ck,
            'User-Agent': ua,
            'Referer': url
        }
        while True:
            try:
                res = requests.get(url=url, headers=headers, timeout=(5, 5)).content.decode('utf-8', errors='ignore')
                break
            except:
                time.sleep(2)
        if f'抱歉，未找到“{k}”相关结果。
' in res:
            break
        tree = etree.HTML(res)
        for li in tree.xpath('//div[@action-type="feed_list_item"]'):
            name = li.xpath('.//a[@class="name"]/text()')[0]
            date = li.xpath('.//p[@class="from"]/a/text()')[0].strip()
            cbox = li.xpath('.//p[@node-type="feed_list_content_full"]')
            cbox = li.xpath('.//p[@node-type="feed_list_content"]')[0] if not cbox else cbox[0]
            cont = '\n'.join(cbox.xpath('./text()')).strip()
            tran = li.xpath('.//div[@class="card-act"]/ul/li[1]/a//text()')[1].strip()
            try:
                tran = eval(tran)
            except:
                tran = 0
            comm = li.xpath('.//div[@class="card-act"]/ul/li[2]/a//text()')[0].strip()
            try:
                comm = eval(comm)
            except:
                comm = 0
            like = li.xpath('.//div[@class="card-act"]/ul/li[3]/a//text()')[0].strip()
            try:
                like = eval(like)
            except:
                like = 0
            ID = li.xpath('./@mid')[0]
            dic = {
                '昵称': name,
                '时间': date,
                '内容': cont,
                '转发': tran,
                '评论': comm,
                '点赞': like,
                '链接': f'https://m.weibo.cn/detail/{ID}',
                'ID': ID
            }
            resLs.append(dic)
            print(dic)
    df = pd.DataFrame(resLs)
    df.to_excel('D:/python-projects/微博搜索.xlsx', index=False)


if __name__ == '__main__':
    ck = 'SINAGLOBAL=4454308048539.024.1643708323694; UOR=,,www.baidu.com; PC_TOKEN=a92ce85638; SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WFM8PQNOuSqoMODXmj7s6._5JpX5KMhUgL.FoMceh5Xe024SK52dJLoI0qLxK-L1K.L1-eLxK-L1K-LBKqLxK-L1K.L1-eLxK-L1K-LBKqLxK-L1KnL1--LxKMLB.zLB.qt; ALF=1686135504; SSOLoginState=1654599505; SCF=AsEb2zshx_FnkEijdlcLhh6otJzpQ8lkHk85ZOPwgAo2aHvNLE4plpr8df82bpCcn7X4xaDNKey82rxt5vxU7ao.; SUB=_2A25Pm18BDeRhGeFI61IV8y_FzjyIHXVs0TfJrDV8PUNbmtAfLUvTkW9NfWwekjxblRZSYlCn6pgNSJyzae4TacWZ; XSRF-TOKEN=j-jv-3EZdbv8diWwSDRg6Ala; WBPSESS=Ml88U9RPTFLzaBK37303P30soCZeyxsaXD-HRJbXS-Gosuo1qU_H6W_kmZRpTh27MhD6E3SIXJ_wbKp5CF_WExjeXE7lBgmyjKqeNr33sxzvpIW7j9bQlB_OsVdOEA9rcAwOvwUIe8jl2UwcyPTBig==; _s_tentry=weibo.com; Apache=9328862948114.203.1654599516792; ULV=1654599516822:24:2:1:9328862948114.203.1654599516792:1654329837929'
    ua = 'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/91.0.4472.106Safari/537.36'
    collect('#新年贺词#', '2022-12-31:2023-01-01')

结果显示

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阳光宅男xxb 2023-01-06 11:25
关注
pip install openpyxl 安装下这个openpyxl库。望采纳哦！！！！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于python的百度云网盘爬虫
2024-01-30 11:04

【标题】"基于Python的百度云网盘爬虫"是一个项目，旨在教用户如何使用Python编程语言编写程序来抓取并下载百度云网盘上的公开资源。该项目涵盖了网络爬虫技术，结合了百度云盘的API接口，以及可能涉及的前端和后端...
Python快乐编程-网络爬虫
2024-01-26 10:43

同时，要学会处理可能出现的异常，如网络连接错误、编码问题等，确保爬虫的稳定运行。最后，随着网络爬虫技术的发展，多线程和异步IO（如使用asyncio库）的应用越来越广泛，它们能显著提高爬虫的效率。此外，...
凯撒密码python爬虫python爬虫
2024-03-02 00:14

【描述】：“python爬虫”是指使用Python编程语言编写的一种自动化程序，用于从互联网上抓取大量数据。Python的requests、BeautifulSoup、Scrapy等库提供了强大的网页抓取和解析能力。而凯撒密码则是通过位移字母表...
spider-python爬虫资源
2024-11-24 06:01

Python爬虫技术正是为了解决这一问题而诞生，它利用Python编程语言简单易学、功能强大的特点，开发出能够自动化浏览网页、抓取网页内容的程序。本资源集旨在为Python编程爱好者、数据分析人员、网络爬虫开发者提供...
python实现的爬虫demo
2024-02-20 10:29

以下是Python爬虫的几个主要优势： 1. **简洁易读**: Python的语法非常简洁和易于理解，使得编写爬虫程序变得相对简单。与其他编程语言相比，Python代码通常更加可读，逻辑清晰，这样就可以更轻松地实现和维护爬虫...
python爬虫实现demo
2024-02-20 10:30

以下是Python爬虫的几个主要优势： 1. **简洁易读**: Python的语法非常简洁和易于理解，使得编写爬虫程序变得相对简单。与其他编程语言相比，Python代码通常更加可读，逻辑清晰，这样就可以更轻松地实现和维护爬虫...
携程网动态网页python爬虫代码恩施大峡谷
2022-02-20 13:57

【标题】：“携程网动态网页python爬虫代码恩施大峡谷”指的是使用Python编程语言编写的一段爬虫程序，专门用于抓取携程网关于恩施大峡谷的相关动态网页数据。爬虫是一种自动化工具，能够按照预设规则遍历互联网上的...
Python爬虫入门教程.docx
2024-12-07 16:23

Python爬虫入门教程详细知识点解析：爬虫定义与基本原理：网络爬虫，或称网络数据采集器，是一种通过编程向网络服务器请求数据，然后解析HTML以提取所需信息的自动化工具。网络爬虫的运作可以归纳为四大步骤：...
基于Python语言的爬虫项目设计源码集合
2024-10-04 11:04

Python作为一门广受欢迎的编程语言，因其简洁易读的语法和强大的库支持，成为开发网络爬虫的首选语言。该项目标题“基于Python语言的爬虫项目设计源码集合”，展示了利用Python语言实现网络爬虫的多种可能性和实践...
Python爬虫小案例（word文档）
2024-10-02 21:41

Python爬虫是一种自动获取网页内容的程序，它可以按照用户的设定抓取特定网站的信息，并将这些信息进行分析和处理。在当前的数据时代，爬虫技术被广泛应用于网络数据采集、搜索引擎优化、市场调研、竞争对手监控等多...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月6日

python爬虫运行问题

1条回答 默认 最新

问题事件

1条回答默认最新