林润华 2022-07-05 20:36 采纳率: 100%
浏览 35
已结题

请问要怎样才能解析EPub里的网页文件?我想以纯文本形式打开EPub的里的网页文件并用正则表达式对他们进行修改.

首先,

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(超文本文件)

结果是:

<EpubHtml:inserted:Text/cover_page.xhtml>
<EpubHtml:x_epub.html:Text/part0000.xhtml>

现实是:

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(open(超文本文件).read())

结果:

Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\活词印刷术.py", line 6, in <module>
    print(open(超文本文件).read())
TypeError: expected str, bytes or os.PathLike object, not EpubHtml

https://github.com/aerkalov/ebooklib/blob/master/ebooklib/epub.py
总得来讲我还有点看不懂源码.

  • 写回答

2条回答 默认 最新

查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月14日
  • 已采纳回答 7月6日
  • 修改了问题 7月5日
  • 修改了问题 7月5日
  • 展开全部

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助