爬取小说章节内容，没有内容

爬取小说内容，url可能写错了，应该怎么改


url='https://www.qidian.com/book/1031940621/'
response=requests.get(url)
html=response.text
soup=BeautifulSoup(html,"html.parser")
chapter_list=soup.find_all("li",class_="clearfix")
chapter_links=[]

for chapter in chapter_list:
    chapter_link=chapter.a.get("href")
    chapter_links.append(chapter_link)

novel_content=""

for chapter_link in chapter_links:
    chapter_reponse=requests.get(chapter_link)
    chapter_html=chapter_reponse.text
    chapter_soup=BeautifulSoup(chapter_html,"html.parser")
    chapter_title=chapter_soup.find("h3").text
    chapter_content=chapter_soup.find("div",class_="read-content").text
    novel_content+=chapter_title+"\n"+chapter_content+"\n"
    
with open("novel.txt","w",encoding="utf-8")as file:
    file.write(novel_content)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

Leodong. 2023-12-08 13:43

关注

该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索并已验证,得到内容具体如下：
根据您提供的代码，我发现可能的问题是章节链接的格式不正确。在爬取小说章节内容时，需要确保链接是正确的。以下是修改后的代码：

import requests
from bs4 import BeautifulSoup

url = 'https://www.qidian.com/book/1031940621/'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, "html.parser")
chapter_list = soup.find_all("li", class_="clearfix")
chapter_links = []

for chapter in chapter_list:
    chapter_link = chapter.a.get("href")
    if chapter_link.startswith('/'):
        chapter_link = url + chapter_link
    chapter_links.append(chapter_link)

novel_content = ""

for chapter_link in chapter_links:
    chapter_reponse = requests.get(chapter_link)
    chapter_html = chapter_reponse.text
    chapter_soup = BeautifulSoup(chapter_html, "html.parser")
    chapter_title = chapter_soup.find("h3").text
    chapter_content = chapter_soup.find("div", class_="read-content").text
    novel_content += chapter_title + "\n" + chapter_content + "\n"

with open("novel.txt", "w", encoding="utf-8") as file:
    file.write(novel_content)

这段代码首先检查章节链接是否以斜杠（/）开头，如果是，则将其与基本URL拼接起来。这样可以确保获取到正确的章节链接。

如果以上回答对您有所帮助，点击一下采纳该答案～谢谢

报告相同问题？

关注问题

基于Python及多语言技术的小说爬取设计源码
2024-09-29 06:58

本项目提供的是一种基于Python编程语言和多语言技术的小说内容爬取设计源码。它的主要功能是高效地从互联网上抓取并解析小说内容，同时支持多种编程语言的协同工作，以达到信息获取与整理的高效率和稳定性。项目...
Python爬取小说源代码，Python实现小说自由
2022-12-26 10:20

本项目名为"Python爬取小说源代码，Python实现小说自由"，旨在利用Python编程语言来自动化下载网络小说，实现无需在线阅读即可拥有全部章节内容的目标。通过这个项目，我们可以学习到以下几个关键的Python爬虫知识点...
python爬取vip小说章节_用python爬取小说章节内容
2020-11-20 21:57

weixin_39633954的博客原博文2019-02-05 16:47 −在学爬虫之前, 最好有一些html基础... 获取内容 4. 处理内容 5. 写入文件代码如下: 1 #导入相关model 2 from bs4 import BeautifulSoup 3 im...相关推荐2019-09-28 21:13 −Python python...
《Python程序设计》结课大作业-爬取小说内容项目
2025-08-08 16:35

《Python程序设计》结课大作业——爬取小说内容项目是针对学习Python编程语言的学生，在课程结束时完成的一个实战项目。该项目的主要目标是通过编写程序，自动从互联网上抓取小说文本内容。这不仅能够加深学生对...
Python爬取小说网站的小说
2023-05-05 10:45

Python是一种广泛应用于Web开发、数据分析、自动化任务等领域的高级编程语言，尤其在数据抓取（网络爬虫）方面，Python表现出强大的能力。本教程将详细讲解如何使用Python来爬取小说网站上的小说内容。首先，我们...
Python爬取小说并存入到mysql数据库源代码
2022-12-26 10:28

Python是一种广泛应用于数据分析、Web开发和自动化任务的高级编程语言，尤其在爬虫领域表现出色。本项目将向你展示如何使用Python编写一个网络爬虫，以获取在线小说的内容，并将其存储到MySQL数据库中。首先，我们...
基于Python的Scrapy框架小说爬取设计源码
2024-09-25 07:37

该系统的核心是基于Python编程语言和Scrapy爬虫框架开发，Scrapy是一个快速、高层次的网页抓取及爬虫框架，用于抓取网站数据并提取结构化数据。它适合爬取某些网站，并可以应用于各种不同的项目。该系统通过一系列...
基于Python的notice-get小说爬取设计源码
2024-10-02 02:34

在当今数字时代，互联网上的数据抓取变得越来越普遍，而小说网站作为内容丰富的数据源之一，吸引了大量的爬虫开发者的兴趣。Python作为一种广泛应用于数据抓取、网络爬虫开发的语言，其强大的库支持和简洁的语法使其...
Python爬取小说并保存[源码]
2025-11-13 07:15

本文将详细介绍如何利用Python编程语言中的爬虫技术来爬取网络小说内容并保存至本地计算机。 Python因其简洁的语法和强大的第三方库支持，成为编写爬虫程序的首选语言。在爬取小说的过程中，我们会使用到多个Python...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月8日

爬取小说章节内容，没有内容

4条回答 默认 最新

问题事件

4条回答默认最新