林润华 2022-07-05 20:36 采纳率: 100%
浏览 35
已结题

请问要怎样才能解析EPub里的网页文件?我想以纯文本形式打开EPub的里的网页文件并用正则表达式对他们进行修改.

首先,

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(超文本文件)

结果是:

<EpubHtml:inserted:Text/cover_page.xhtml>
<EpubHtml:x_epub.html:Text/part0000.xhtml>

现实是:

import ebooklib as 电接#电子书接口
from ebooklib import epub as 电版#电子出版
路径='30天自制操作系统 (川合秀实) (z-lib.org).epub'
实例化的书 = 电版.read_epub(路径)
for 超文本文件 in 实例化的书.get_items_of_type(电接.ITEM_DOCUMENT):
    print(open(超文本文件).read())

结果:

Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\活词印刷术.py", line 6, in <module>
    print(open(超文本文件).read())
TypeError: expected str, bytes or os.PathLike object, not EpubHtml

https://github.com/aerkalov/ebooklib/blob/master/ebooklib/epub.py
总得来讲我还有点看不懂源码.

  • 写回答

2条回答 默认 最新

查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月14日
  • 已采纳回答 7月6日
  • 修改了问题 7月5日
  • 修改了问题 7月5日
  • 展开全部

悬赏问题

  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计