爬虫的有声小说制作（用python）

做一个爬取小说的网站
网站要先注册，登录
网站要有搜索引擎，输入小说名就可以下载整本小说，依章节分序下载到txt
经过前面几步，可以将文本小说转化成语音小说，并保存到本地的音频文件中（如：点击一个章节，这章就可转成语音）
转成语音后，在网站上读，可以暂停
美化网站，以上都要在网站上进行，使用python，提供源代码，要求可以运行成功
（没有诚意就不要回答了）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

14条回答默认最新

threenewbee 2023-09-07 15:21

关注

import requests
import re
from urllib.parse import urljoin
import urllib3
from lxml import etree
urllib3.disable_warnings()#解决warning

class Tingshu_bao_spider:
    def do_get_request(self,url):
        """
        发送网络请求，获取网页源代码
        :param url:
        :return:
        """
        headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36",
                 "Referer":url}
        try:
            r=requests.get(url,headers=headers,timeout=6)
            if r.status_code==200:
                r.encoding=r.apparent_encoding
                html=r.text
                return html
            else:
                return  False
        except:
            return False

    def get_novel_detail(self,sound_link):
        """
        获取小说详情
        :param sound_link:
        :return:
        """
        novel_detail_item={}
        html=self.do_get_request(sound_link)
        if html:
            res=etree.HTML(html)
            name=res.xpath('//div[@class="book-cell"]/h1[@class="book-title"]/text()')
            if name:
                novel_detail_item['novel_name']=name[0].split("有声小说简介：")[0]
            else:
                novel_detail_item['novel_name']="未知"
            cover=res.xpath('//div[@class="book"]/img[@class="book-cover"]/@src')
            if cover:
                novel_detail_item['novel_cover']=urljoin(sound_link,cover[0])
            else:
                novel_detail_item['novel_cover']="未知"
            datas=res.xpath('//div[@class="book-rand-a"]//text()')
            if datas:
                novel_detail_item['novel_type'] = datas[1]
                novel_detail_item['novel_status'] = datas[3]
                novel_detail_item['novel_update_time'] = datas[-1]

            else:
                novel_detail_item['novel_type']="未知"
                novel_detail_item['novel_status'] = "未知"
                novel_detail_item['novel_update_time'] = "未知"
            #作者
            data2 = res.xpath('//div[@class="book-des"]/p/a/text()')
            if data2:
                novel_detail_item['novel_author'] = data2[0]
                novel_detail_item['novel_anchor'] = data2[-1]
            else:
                novel_detail_item['novel_author']="未知"
                novel_detail_item['novel_anchor']="未知"

            introduce = res.xpath('//div[@class="book-des"]/text()')
            if introduce:
                novel_detail_item['novel_introduce'] = introduce[0]
            else:
                novel_detail_item['novel_introduce']="未知"
            selector=res.xpath('//div[@id="playlist"]/ul/li')
            play_list=[]
            for data in selector:
                play_item={}
                novel_play_name=data.xpath("./a/@title")
                if novel_play_name:
                    play_item["play_name"]=novel_play_name[0]
                else:
                    play_item["play_name"]="NULL"
                novel_play_link = data.xpath("./a/@href")
                if novel_play_name:
                    play_item["play_link"] = urljoin(sound_link,novel_play_link[0])
                else:
                    play_item["play_link"]="NULL"
                play_list.append(play_item)
            novel_detail_item['play_list']=play_list
            return novel_detail_item
        else:
            return False

    def get_audio_play_link(self,detail_intro_link):
        """
        获取小说播放链接地址
        :param detail_intro_link:
        :return:
        """
        html=self.do_get_request(detail_intro_link)
        if html:
            base_url="https://t3344t.tingchina.com/"
            aim_asciis=re.findall("FonHen_JieMa\('(.*?)'",html)
            if aim_asciis:
                sp = aim_asciis[0].split("*")
                res = ""
                for s in sp:
                    if s != "":
                        if "-" in s:
                            res += chr((int(~int(s.replace("-", '')) & 0xffff) + 1))
                        else:
                            res += chr(int(s))
                aim_suffix = "/" + res.split('&')[0].split('/', 1)[-1]
                play_url=urljoin(base_url,aim_suffix)
                return play_url
            else:
                return False
        else:
            return False

if __name__ == '__main__':
    t=Tingshu_bao_spider()
    aim_url='http://m.tingshubao.com/book/2267.html'
    print(t.get_novel_detail(aim_url))
    print(t.get_audio_play_link('http://m.tingshubao.com/video/?2267-0-0.html'))

参考：

Python3网络爬虫--爬取有声小说（附源码）_有声小说源码_懷淰メ的博客-CSDN博客在第二个class为book的div标签中能得到小说简介、作者、播音。本次分析了一个有声小说网站，重点在于分析其小说详情页、音频播放地址，加密方式判断。思路、代码方面有什么不足欢迎各位大佬指正、批评！_有声小说源码

https://blog.csdn.net/a1397852386/article/details/122085836

报告相同问题？

关注问题

零基础也能玩转！Python爬虫抓取网络小说全攻略（附实战代码）
2025-06-11 16:04

notion2025的博客虽然技术无罪，但使用需谨慎！建议从学习角度出发，不要用于商业用途。遇到付费内容请支持正版，好的创作环境需要大家共同维护~（注：本文示例代码需替换真实网址后使用，仅供学习交流）
越来越好玩，用ChatGPT+Python 做有声小说！
2024-09-04 18:05

疯狂的超级玛丽的博客上面是目前市场上比较好的做语音合成的大厂和平台，目前做的比较好的是微软的，但是门槛也比较高，大家可以自行去研究一下，我们这里用百度做一个demo给大家简单讲一下，怎么做的。因为百度的应用很多的，大家可以看...
Python制作属于自己的有声小说
2020-05-21 13:42

嗨学编程的博客本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者：merlin& 操作环境 Python版本： anaconda3 python3.7.4 操作系统： Ubuntu19.10...
Python爬虫百例第71讲案例素材.zip
2020-06-12 18:08

首先，Python作为一门强大的编程语言，因其简洁的语法和丰富的库支持，在爬虫领域占据着重要地位。在Python中，我们常用的爬虫库有requests用于发送HTTP请求，BeautifulSoup或lxml用于解析HTML文档，以及Scrapy框架...
Python爬虫下载喜马拉雅音频文件：轻松获取有声资源
2025-05-20 16:33

蒙跃旖的博客 Python爬虫下载喜马拉雅音频文件：轻松获取有声资源【下载地址】Python爬虫下载喜马拉雅音频文件这个开源项目提供了一个使用Python进行网络爬虫的实例教程，专注于如何下载喜马拉雅音频文件。教程详细介绍...
python读取文本_教你用Python制作有声书
2020-12-20 07:33

weixin_39581964的博客记得之前看到过Python有一个工具包，可以将文字转换为语音，支持英文和中文，而且能调节语速语调、导出mp3等。去Github查了下，这个库叫：pyttsx3简单来说，pyttsx3可以文字转语音，且是离线工...
python自制有声小说
2020-08-10 13:52

Python新世界的博客很多人学习python，不知道从何学起。很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。很多已经做案例的人，却不知道如何去学习更加高深的知识。那么针对这三类人，我给大家提供一个好的学习...
Python爬虫实战：抓取喜马拉雅FM节目数据全流程详解
2025-06-05 15:59

Python爬虫项目的博客本文系统介绍了抓取喜马拉雅FM节目数据的思路与实战，从接口分析、同步异步实现，到反爬机制应对与多线程并发，全面提升爬虫开发能力。未来可以结合NLP做内容分析、音频特征挖掘等高级应用。
Python爬取有声小说
2019-08-12 20:52

嗨学编程的博客 ###功能如下： 1.批量下载 2.批量命名 3.界面化显示 ###整体思路： 1.请求网站，根据返回的网站源码，查找包含资源链接的标签 2.请求资源链接，将资源保存的本地，并命名 3.分析包含资源的网页规律...Python学习交...
网络爬虫与音频处理_Python_Tkinter交互界面_requests网络请求_JSON解析_异常处理_多线程下载_小说有声书音频批量下载工具_支持断点续传_文件存在检查_下载.zip
2025-05-25 14:11

该压缩包文件包含了一款名为“网络爬虫与音频处理”的软件工具，该工具主要是用Python编程语言开发，并且集成了Tkinter图形用户界面库来创建交互式窗口。工具的核心功能包括使用requests库进行网络请求，能够解析...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月7日
展开全部

爬虫的有声小说制作（用python）

14条回答 默认 最新

问题事件

14条回答默认最新