#导入ebooklib名字用电接替代,电接是电子书接口的意思
import ebooklib as 电接
#导入ebooklib中的epub,电书是电子书的意思
from ebooklib import epub as 电书
#导入正则表达式模块,并用正则这个名称代替re
import regex as 正则
#导入数据库模块,数库的意思是数据库
import sqlite3 as 数库
#路径是 活词印刷术.py 所在位置需要处理文件的书名(别忘了.epub)
路径=input('请输入放在"活词印刷术.py"所在文件路径的一个"…….epub"文件的名称(别忘了.epub):')
#实库的意思是实例化数据库.id序列,word单词,sw小写化单词,phonetic音标,definition英文释义,translation中文释义……
实库=数库.connect('活词印刷术.db')
游标=实库.cursor()
#实书是实例化书的意思
实书 = 电书.read_epub(路径)
#查找英语单词所用到的正则表达式,搜英是搜索未标注英语单词的意思
搜英=r'(?<!☾[^☽]*|<[^>]*|{[^}]*)(?<=[^a-zA-Z0-9\-_αβγμΓé@])[a-zA-Z0-9\-_αβγμΓé@]+(?=[^a-zA-Z0-9\-_αβγμΓé@])(?!<span style="color:green">|[^<]*(</style>|>)|[^☾]*☽)'
#当节是当前章节的意思
for 当节 in 实书.get_items_of_type(电接.ITEM_DOCUMENT):
#将当节的内容转换成字符串并保存在当容中,当容的意思是当节内容
当容=当节.content.decode()
while True:
#在当容搜索未标注的英语单词(不区分大小写),返回英语单词,以备后用.是新否停意思是如果为是搜到新单词并返回字符串,如果为None则继续循环
是新否停=正则.search(搜英,当容,正则.IGNORECASE)
if 是新否停:是新否停=是新否停.group();print(是新否停)
elif 是新否停==None:break
游标.execute('SELECT DISTINCT translation FROM stardict WHERE word=%s'%(是新否停))
#查翻的意思是查找到的翻译
查翻=游标.fetchone()[0]
#替本的意思是替换文本的意思,把搜英捕捉到的英文字符串换成替本的内容
替本='%s<span style="color:green">☾%s☽</span>'%(是新否停,查翻)
#替换内存中保留的"当节"内容的英文部分
当节.content=正则.sub(搜英,替本,当容,count=1)
#已标已翻是已标注或已翻译的意思,这条命令会覆盖之前已标已翻的EPub文件
电书.write_epub('☾已标已翻☽'+路径,实书)
Python和SQLite如何在用SELECT语句查询数据库时忽略'_'和'-'认为他们是一个符号并且忽略大小写?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- CSDN专家-sinJack 2022-07-08 19:34关注
可以试下是不是忽略大小写,mysql是忽略大小写的。
'_'和'-'认为他们是一个符号?将where 后面查询的字段内容替换一下(_替换为-)本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 根据会员信息表绘制堆积柱状图
- ¥100 华为手机私有App后台保活
- ¥20 有谁能看看我coe文件到底哪儿有问题吗?
- ¥20 我的这个coe文件到底哪儿出问题了
- ¥15 matlab使用自定义函数时一直报错输入参数过多
- ¥15 设计一个温度闭环控制系统
- ¥100 rtmpose姿态评估
- ¥15 java 通过反射找路径下的类,打包后就找不到
- ¥15 通联支付网上收银统一下单接口
- ¥15 angular有偿编写,