python爬虫没有结果返回

使用Python爬虫，代码没有问题，我是用的pycharm，朋友用的Vscode，她可以运行但是我运行不了，结果返回是空的，也不报错，以下是代码

import requests
import re
import pandas as pd
from lxml import etree
from bs4 import BeautifulSoup
import pandas as pd
import matplotlib.pyplot as plt

url = 'https://www.jjwxc.net/topten.php?orderstr=7&t=0'
headers = {
    'cookie': '__yjs_duid=1_695ffee74a69dc5584c310ec8801cdd11673344566448; testcookie=yes; '
              'Hm_lvt_bc3b748c21fe5cf393d26c12b2c38d99=1673344567; timeOffset_o=-1159.10009765625; '
              'smidV2=202301101756406f750a4c79547b98806fb79f3c774d7a00acd69b212a2e0b0; '
              'JJEVER={"fenzhan":"yq","isKindle":"","background":"","font_size":""}; '
              'JJSESS={"referer":"/book2/7322952"}; '
              'Hm_lpvt_bc3b748c21fe5cf393d26c12b2c38d99=1673358311',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                  'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
text = response.content.decode('gbk')  # 获取网页源码，以文本形式显示
soup = BeautifulSoup(text, 'lxml')


def get_data_all(td):
    # 排名
    pm = td[0].text
    # 作者名
    zz = td[1].text.replace('\xa0', '').replace('\n', '')
    # 书名
    sm = td[2].text.replace('\n', '').replace('\xa0', '')
    # 类型
    lx = td[3].text.replace('\n', '').replace('\xa0', '').replace('\r', '').replace(' ', '')
    # 风格
    fg = td[4].text
    # 字数
    zs = td[6].text.replace('\n', '').replace('\xa0', '')
    # 积分
    jf = td[7].text.replace('\n', '').replace('\xa0', '').replace('\r', '')
    # 发布时间
    fbsj = td[8].text
    return [pm, zz, sm, lx, fg, zs, jf, fbsj]


def get_data(url):
    headers = {
        'cookie': '__yjs_duid=1_695ffee74a69dc5584c310ec8801cdd11673344566448; testcookie=yes; '
                  'Hm_lvt_bc3b748c21fe5cf393d26c12b2c38d99=1673344567; timeOffset_o=-1159.10009765625; '
                  'smidV2=202301101756406f750a4c79547b98806fb79f3c774d7a00acd69b212a2e0b0; '
                  'JJEVER={"fenzhan":"yq","isKindle":"","background":"","font_size":""}; '
                  'JJSESS={"referer":"/book2/7322952"}; Hm_lpvt_bc3b748c21fe5cf393d26c12b2c38d99=1673358311',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    text = response.content.decode('gbk')  # 获取网页源码，以文本形式显
    # 构造bs对象
    soup = BeautifulSoup(text, 'lxml')
    # 查找详细信息所在的tr节点
    tr = soup.find_all('tr', attrs={'bgcolor': '#eefaee'})
    list_all = []
    # 循环查找到的tr节点，并把获取到的信息依次存进空列表list_all
    for i in range(len(tr)):
        td = tr[i].find_all('td')
        add = get_data_all(td)  # 获取信息信息
        list_all.append(add)  # 存进列表
    # 存进小表格
    df = pd.DataFrame(list_all, columns=['排名', '作者名', '书名', '类型', '风格', '字数', '积分', '发布时间'])
    return df


df_all = get_data(url=url)
# 导出数据
df_all.to_csv(r'data.csv', index=False, encoding='utf_8_sig')

有人提议这可能是库的版本问题，附图

请问如何解决呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

7*24 工作者 2023-03-10 16:07

关注


import requests
from lxml import etree
import pandas as pd

url = 'https://www.jjwxc.net/topten.php?orderstr=7&t=0'

def get_data(url):
    headers = {
        'cookie': '__yjs_duid=1_695ffee74a69dc5584c310ec8801cdd11673344566448; testcookie=yes; '
                  'Hm_lvt_bc3b748c21fe5cf393d26c12b2c38d99=1673344567; timeOffset_o=-1159.10009765625; '
                  'smidV2=202301101756406f750a4c79547b98806fb79f3c774d7a00acd69b212a2e0b0; '
                  'JJEVER={"fenzhan":"yq","isKindle":"","background":"","font_size":""}; '
                  'JJSESS={"referer":"/book2/7322952"}; Hm_lpvt_bc3b748c21fe5cf393d26c12b2c38d99=1673358311',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    text = response.content.decode('gbk')  # 获取网页源码，以文本形式显
    # 构造bs对象
    html = etree.HTML(text)
    trs = html.xpath('//table[3]/tbody/tr')

    list_all = []
    # # 循环查找到的tr节点，并把获取到的信息依次存进空列表list_all
    for tr in trs[1:]:
        td_content = tr.xpath('./td//text()')
        item = []
        if len(td_content) == 15:
            item.append( td_content[0].strip() )   #排名
            item.append( td_content[2].strip() )   #作者名
            item.append( td_content[5].strip() )   #书名
            item.append( td_content[7].strip() )   #类型
            item.append( td_content[8].strip() )   #风格
            item.append( td_content[12].strip() )   #字数
            item.append( td_content[13].strip() )   #积分
            item.append( td_content[14].strip() )   #发布时间
            list_all.append(item)
        elif len(td_content) == 13:
            item.append( td_content[0].strip() )   #排名
            item.append( td_content[2].strip() )   #作者名
            item.append( td_content[5].strip() )   #书名
            item.append( td_content[7].strip() )   #类型
            item.append( td_content[8].strip() )   #风格
            item.append( td_content[10].strip() )   #字数
            item.append( td_content[11].strip() )   #积分
            item.append( td_content[12].strip() )   #发布时间
            list_all.append(item)

    # 存进小表格
    df = pd.DataFrame(list_all, columns=['排名', '作者名', '书名', '类型', '风格', '字数', '积分', '发布时间'])
    return df


df_all = get_data(url=url)
# 导出数据
df_all.to_csv(r'data.csv', index=False, encoding='utf_8_sig')

执行后的输出效果：

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

Python 爬虫编程从入门到实践
2024-03-11 13:42

Python编程语言以其简洁明了的语法和强大的功能在IT领域，特别是网络爬虫技术中，占据了重要的地位。本文将深入探讨Python爬虫编程的基础知识，从入门到实践，帮助初学者掌握这一技能。首先，我们要了解什么是网络...
Scrap爬虫框架，使用python编程实现
2024-10-03 13:52

Python作为一种广泛使用的高级编程语言，因其简洁的语法和强大的功能库，在编写网络爬虫方面表现出色。Scrapy是Python中最著名的爬虫框架之一，它是一个快速、高层次的屏幕抓取和网页抓取框架，用于抓取网站并从页面...
Python爬虫是一种使用Python编程语言来自动化获取网页数据的技术这项技术主要涉及到向目标服务器发送请求，获取HTML页
2024-05-02 14:49

Python爬虫是一种利用Python编程语言实现自动化的网页数据抓取技术。它的工作原理主要包括以下几个步骤：首先向目标服务器发送HTTP请求；接着获取服务器返回的HTML页面内容；然后对HTML进行解析以提取所需的数据。...
python爬虫学习文档，包含爬虫基础，加密算法，并发编程，逆向等
2024-01-18 10:28

这份"python爬虫学习文档"涵盖了多个关键领域，包括爬虫基础、加密算法、并发编程以及安卓逆向，旨在帮助学习者全面掌握爬虫相关的高级技能。首先，让我们深入探讨**爬虫基础**。爬虫基础是所有爬虫学习者的起点，...
python爬虫练习.zip
2023-01-14 21:14

Python爬虫是编程语言Python中的一个重要应用领域，它主要用于自动化地从互联网上抓取大量信息。这个"python爬虫练习.zip"压缩包提供了一些简单的爬虫案例，适合初学者进行实践和学习。以下是对这些案例可能涉及的...
Python爬虫详解[项目代码]
2025-11-14 10:42

Python爬虫是一种通过编程方式自动从互联网上抓取数据的程序。它的工作原理是首先定位到目标网页的URL，然后通过发送HTTP请求获取网页内容，最后解析返回的数据，提取出有价值的信息。整个过程类似于人类上网时的...
基于Python的网络爬虫的毕业设计
2022-02-20 11:41

首先，我们关注的是Python这一编程语言，它是网络爬虫开发的首选语言，因为其语法简洁、库丰富且适合快速开发。在Python中，最常用于网络爬虫开发的库有`requests`和`BeautifulSoup`。`requests`库用于发送HTTP...
Python爬虫实现百度翻译源码
2024-04-16 20:44

**Python爬虫实现百度翻译源码** 在编程领域，Python是一种广泛应用的语言，尤其在数据抓取和处理方面，它的强大库支持使得爬虫编写变得简单高效。本篇将深入探讨如何利用Python编写爬虫实现百度翻译的功能。我们将...
python爬虫基础知识、爬虫实例
2025-08-16 15:34

Python作为一门简洁而强大的编程语言，在爬虫领域中尤为突出，因为它不仅有丰富的库支持，还具备简洁易懂的语法。本篇将深入探讨Python爬虫的基础知识，以及通过实例来展示如何进行网络数据的抓取。首先，Python...
python爬虫基础知识、爬虫实例、
2025-08-15 15:24

Python作为一种编程语言，以其简洁易学、功能强大等特点，在爬虫开发领域中独树一帜。本文将详细介绍Python爬虫的基础知识，并通过实例展示如何运用Python进行网络数据的抓取和处理。首先，Python爬虫的基础知识...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月10日

python爬虫没有结果返回

4条回答 默认 最新

问题事件

4条回答默认最新