python爬取小说十章，程序可以运行，但什么都没有跑出来，想请教下代码哪里出错了？（电脑是Mac）

import requests
import re
import os
html = requests.get('https://www.kanunu8.com/book/5874/').content.decode('GB2312')
def get_toc(html):
    toc_url_list = []
    toc_block = re.findall('正文(.*?)</tbody>', html, re.S)[0]
    toc_url = re.findall('href="(.*?)"', toc_block, re.S)
    for url in toc_url:
        toc_url_list.append('https://www.kanunu8.com/book/5874/'+url)
    return toc_url_list
httls = get_toc(html)
for httl in httls:
    httl = requests.get(httl).content.decode('GBK')
def get_article(httl):
    chapter_name = re.search('size="4">(.*?)<', httl, re.S).group(1)
    text_block = re.search('<p>(.*?)</p>', httl, re.S).group(1)
    text_block = text_block.replace('<br />', '')
    return chapter_name, text_block
chapter_name = get_article(httl)
text_block = get_article(httl)
def save(chapter_name, text_block):
    os.makedirs('风雨燕归来', exist_ok=True)
    file_path = os.path.join('风雨燕归来', 'chapter_name.txt')
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write(text_block)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2021-09-08 08:55

关注

改成下面的就行，有帮助麻烦点个采纳【本回答右上角】，谢谢~~
你的问题主要在于获取内容的代码未放如for循环中，save也未调用，还有一些小问题看注释


import requests
import re
import os


def get_toc(html):
    toc_url_list = []
    toc_block = re.findall('正文(.*?)</tbody>', html, re.S)[0]
    toc_url = re.findall('href="(.*?)"', toc_block, re.S)
    for url in toc_url:
        toc_url_list.append('https://www.kanunu8.com/book/5874/'+url)
    return toc_url_list


def get_article(httl):
    chapter_name = re.search('size="4">(.*?)<', httl, re.S).group(1)

    text_block = re.search('<p>(.*?)</p>', httl, re.S).group(1)
    text_block = text_block.replace('<br />', '')
    return chapter_name,text_block

#下面这2局放到上面的for..in里面，而且for...in调整下位置
#chapter_name = get_article(httl)

#text_block = get_article(httl)

def save(chapter_name, text_block):
    os.makedirs('风雨燕归来', exist_ok=True)
    file_path = os.path.join('风雨燕归来', chapter_name+'.txt')#这里文件名直接写死了，未使用传入的参数
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write(text_block)



html = requests.get('https://www.kanunu8.com/book/5874/').content.decode('GB2312')

httls = get_toc(html)
for httl in httls:
    httl = requests.get(httl).content.decode('GBK')
    chapter_name,text_block = get_article(httl)#只需要调用一次分别获取对应的值就行
    save(chapter_name,text_block)#==========调用保存

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

【Python爬虫+pyecharts可视化】爬取全国各地房价并在echarts的geo地图上展示
2021-04-21 17:48

fengzibs的博客（代码所用模块都是可以用 pip install 模块名下载的哟）目录项目需求总体分析详细分析代码实现代码测试维护更新项目需求获取全国各地的房价，计算出平均值，并用echarts中的geo图表进行展示。 ...
Python小小练习
2025-07-25 23:53

第九条雀的博客三次握手完成，连接就建立起来了，双方可以开始传输数据而四次挥手是断开 TCP 连接的过程，因为 TCP 是全双工通信，双方都需要分别关闭连接第一次挥手：客户端发送 FIN 报文，表示自己没有数据要发送了，想关闭...
Python安全攻防-从入门到入狱
2022-01-31 20:10

{Yasso}的博客 Python安全攻防-从入门到入狱
[Python] - 爬虫之 Selenium 的使用
2018-01-06 18:14

iMazy的博客 Mac OS 系统安装浏览器驱动器 Drivers 快速入门简单尝试使用 Selenium 写测试案例页面操作和网页交互填充表单拖放弹出对话框导航历史和位置 Cookies 元素查找总体概述通过 ID 查找通过 Name 查找 ...
介绍python
2024-10-10 20:41

狂宠粉博主的博客简单易用开源且免费Web开发GitHub代码库运行速度if True:pass断言（assert）语句global学习方法位置参数定义s = 1n = n - 1s = s * xreturn s默认参数（可省略参数）定义s = 1n = n - 1s = s * xreturn s关键字参数...
Python爬虫学习-Day3
2019-03-03 21:43

Frank.F.Wu的博客文章目录一、Beautiful Soup使用1、简介2、四大种类对象1）Tag2）NavigableString3）BeautifulSoup4）Comment3、遍历文档树1）直接子节点2）...名查找2）通过类名查找3）通过id名查找4）获取内容二、丁香园评论爬取...
android 竞品分析工具对比
2018-03-02 10:56

MrCheChe的博客最近一段时间因为琐事（有公有私）太多，加上搬家后，家里断网了一周，虽然有很多东西想写，但却迟迟没有动手。好在目前基本事情都搞完，又可以愉快的写东西了，所以，接下来博客更新的频率将会有所提高。写博客的...
那些值得你试试的Android竞品分析工具
2016-08-12 10:25

superbigcupid的博客让我们得以了解竞品相应的一些技术信息，例如：代码质量、某种业务的实现方式、用了什么第三方库等。除此之外，也有一些高端玩家会玩起 HOOK ，更有甚者是通过修改代码然后进行二次打包。当然这些损害开发者利益的...
竞品分析工具汇总
2016-07-05 13:39

曾经的Android开发的博客本文整理了一些自己在开发过程中经常会用到的竞品分析工具，这些工具可以帮助分析竞品。让我们得以了解竞品相应的一些技术信息，例如：代码质量、某种业务的实现方式、用了什么第三方库等。除此之外，也有一些高端...
那些值得你试试的 Android 竞品分析工具
2016-07-22 14:50

yangxi_001的博客最近一段时间因为琐事（有公有私）太多，加上搬家后，家里断网了一周，虽然有很多东西想写，但却迟迟没有动手。好在目前基本事情都搞完，又可以愉快的写东西了，所以，接下来博客更新的频率将会有所提高。写博客的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月8日

python爬取小说十章，程序可以运行，但什么都没有跑出来，想请教下代码哪里出错了？（电脑是Mac）

2条回答 默认 最新

问题事件

2条回答默认最新