林润华 2022-07-05 20:36 采纳率: 100%
浏览 35
已结题

请问要怎样才能解析EPub里的网页文件?我想以纯文本形式打开EPub的里的网页文件并用正则表达式对他们进行修改.

首先,

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(超文本文件)

结果是:

<EpubHtml:inserted:Text/cover_page.xhtml>
<EpubHtml:x_epub.html:Text/part0000.xhtml>

现实是:

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(open(超文本文件).read())

结果:

Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\活词印刷术.py", line 6, in <module>
    print(open(超文本文件).read())
TypeError: expected str, bytes or os.PathLike object, not EpubHtml

https://github.com/aerkalov/ebooklib/blob/master/ebooklib/epub.py
总得来讲我还有点看不懂源码.

  • 写回答

2条回答 默认 最新

查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月14日
  • 已采纳回答 7月6日
  • 修改了问题 7月5日
  • 修改了问题 7月5日
  • 展开全部

悬赏问题

  • ¥15 Android STD快速启动
  • ¥15 如何使用simulink建立一个永磁同步直线电机模型?
  • ¥30 天体光谱图的的绘制并得到星表
  • ¥15 PointNet++的onnx模型只能使用一次
  • ¥20 西南科技大学数字信号处理
  • ¥15 有两个非常“自以为是”烦人的问题急期待大家解决!
  • ¥30 STM32 INMP441无法读取数据
  • ¥15 R语言绘制密度图,一个密度曲线内fill不同颜色如何实现
  • ¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
  • ¥15 用visualstudio2022创建vue项目后无法启动