爬取小说章节内容出错

为什么没有内容


import requests
from bs4 import BeautifulSoup
 
url = 'https://www.qidian.com/book/1031940621/'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, "html.parser")
chapter_list = soup.find_all("li", class_="clearfix")
chapter_links = []
 
for chapter in chapter_list:
    chapter_link = chapter.a.get("href")
    if chapter_link.startswith('/'):
        chapter_link = url + chapter_link
    chapter_links.append(chapter_link)
novel_content = ""
 
for chapter_link in chapter_links:
    chapter_reponse = requests.get(chapter_link)
    chapter_html = chapter_reponse.text
    chapter_soup = BeautifulSoup(chapter_html, "html.parser")
    chapter_title = chapter_soup.find("h3").text
    chapter_content = chapter_soup.find("div", class_="read-content").text
    novel_content += chapter_title + "\n" + chapter_content + "\n"
    
with open("novel.txt", "w", encoding="utf-8") as file:
    file.write(novel_content)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
虫虫仙人 2023-12-08 14:38
关注
兄弟，你多打印几次就知道了
chapter_list值为空
应该是你写的路径错了
你重写xpath检查看看

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬取小说-26-了解推导式.ev4.rar
2023-10-16 20:50

在Python编程语言中，推导式是一种简洁而强大的语法结构，用于快速生成序列，如列表、集合或元组。在本教程中，我们将深入探讨如何使用推导式来提高代码的可读性和效率，特别是在爬取小说数据时，推导式能够帮助我们...
手把手教你用Python爬取某网小说数据，并进行可视化分析
2023-05-04 11:17

Python小远的博客借助相关互联网手段来表现文学作品及含有一部分文字作品的网络技术产品，在当前成为一种新兴的文学现象，并快速兴起，各种网络小说也是层出不穷，今天我们使用selenium爬取红袖天香网站小说数据，并做简单数据可视化...
Python 爬取必应壁纸的实例讲解
2020-09-17 21:09

Python爬取必应壁纸的实例讲解是一个非常实用的教程，它展示了如何利用Python编程语言从Bing网站上抓取每日壁纸并保存到本地。在这个过程中，我们主要涉及到以下几个知识点： 1. **网络请求库requests**：`requests...
Python 爬虫高级实战：爬取知乎内容并分析用户画像
2026-01-16 22:03

python 爬虫工程师的博客本文介绍了2026年第二届人工智能与产品设计国际学术会议(AIPD2026)相关信息，并详细讲解了基于Python的知乎用户数据爬取与画像分析方法。文章从环境搭建、爬虫原理、核心代码实现到用户画像构建，系统展示了从数据...
python3实现爬取淘宝美食代码分享
2020-09-20 02:10

在本篇文章中，作者介绍了使用Python 3编程语言结合一些常用的Python库来实现爬取淘宝平台上美食相关信息的完整流程。这一过程涉及到网络爬虫的基本原理和实践技巧，包括模拟浏览器操作、网页内容的解析、以及数据的...
Python 爬虫实战：爬取豆瓣小组讨论内容与热度
2026-01-02 18:43

python 爬虫工程师的博客本文介绍了基于Python爬虫技术对豆瓣小组讨论内容进行抓取和分析的实战方案。通过Requests+BeautifulSoup结合正则表达式构建爬虫，突破豆瓣反爬机制，抓取"Python学习"小组的帖子信息及互动数据。利用...
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客如果对电影信息感兴趣，那么可以通过Python编程语言来爬取豆瓣电影的相关信息。下面将介绍如何使用Python爬取豆瓣电影信息的步骤。一、前言豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。...
AI+代理IP手把手教你爬取某度
2025-04-18 08:00

小满大王i的博客 AI+代理IP手把手教你爬取某度
如何使用 Python 爬取天气预报网站的内容，并通过邮件发送爬取结果到指定邮箱地址
2023-11-06 12:04

汪子熙的博客本文是作者参加腾讯云社区选题...题目为：如何使用Python 爬取网页（例如天气，每日问好等等）出题者的动机是：每天早上要和妹子说早安，想要做个定时任务，每天早上能自动爬取天气，发送天气问好邮件，希望大神支招。
python爬取m3u8文件并合并输出
2024-09-17 01:14

Python是一种广泛使用的高级编程语言，以其简洁的语法和强大的库支持而闻名。在处理M3U8文件时，Python的第三方库，例如requests，可以用来发送网络请求获取M3U8文件的内容。通过解析M3U8文件中的每一行，可以获取到...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日

爬取小说章节内容 出错

3条回答 默认 最新

问题事件

爬取小说章节内容出错

3条回答默认最新