林润华 2022-07-08 19:22 采纳率: 100%
浏览 45
已结题

Python和SQLite如何在用SELECT语句查询数据库时忽略'_'和'-'认为他们是一个符号并且忽略大小写?

#导入ebooklib名字用电接替代,电接是电子书接口的意思
import ebooklib as 电接

#导入ebooklib中的epub,电书是电子书的意思
from ebooklib import epub as 电书

#导入正则表达式模块,并用正则这个名称代替re
import regex as 正则

#导入数据库模块,数库的意思是数据库
import sqlite3 as 数库

#路径是 活词印刷术.py 所在位置需要处理文件的书名(别忘了.epub)
路径=input('请输入放在"活词印刷术.py"所在文件路径的一个"…….epub"文件的名称(别忘了.epub):')

#实库的意思是实例化数据库.id序列,word单词,sw小写化单词,phonetic音标,definition英文释义,translation中文释义……
实库=数库.connect('活词印刷术.db')
游标=实库.cursor()

#实书是实例化书的意思
实书 = 电书.read_epub(路径)

#查找英语单词所用到的正则表达式,搜英是搜索未标注英语单词的意思
搜英=r'(?<!☾[^☽]*|<[^>]*|{[^}]*)(?<=[^a-zA-Z0-9\-_αβγμΓé@])[a-zA-Z0-9\-_αβγμΓé@]+(?=[^a-zA-Z0-9\-_αβγμΓé@])(?!<span style="color:green">|[^<]*(</style>|>)|[^☾]*☽)'

#当节是当前章节的意思
for 当节 in 实书.get_items_of_type(电接.ITEM_DOCUMENT):
    #将当节的内容转换成字符串并保存在当容中,当容的意思是当节内容
    当容=当节.content.decode()
    while True:
        #在当容搜索未标注的英语单词(不区分大小写),返回英语单词,以备后用.是新否停意思是如果为是搜到新单词并返回字符串,如果为None则继续循环
        是新否停=正则.search(搜英,当容,正则.IGNORECASE)
        if 是新否停:是新否停=是新否停.group();print(是新否停)
        elif 是新否停==None:break
        游标.execute('SELECT DISTINCT translation FROM stardict WHERE word=%s'%(是新否停))
        #查翻的意思是查找到的翻译
        查翻=游标.fetchone()[0]
        #替本的意思是替换文本的意思,把搜英捕捉到的英文字符串换成替本的内容
        替本='%s<span style="color:green">☾%s☽</span>'%(是新否停,查翻)
        #替换内存中保留的"当节"内容的英文部分
        当节.content=正则.sub(搜英,替本,当容,count=1)

#已标已翻是已标注或已翻译的意思,这条命令会覆盖之前已标已翻的EPub文件
电书.write_epub('☾已标已翻☽'+路径,实书)
  • 写回答

2条回答 默认 最新

  • CSDN专家-sinJack 2022-07-08 19:34
    关注

    可以试下是不是忽略大小写,mysql是忽略大小写的。

    img


    '_'和'-'认为他们是一个符号?将where 后面查询的字段内容替换一下(_替换为-)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 7月16日
  • 已采纳回答 7月8日
  • 创建了问题 7月8日

悬赏问题

  • ¥15 爬取豆瓣电影相关处理
  • ¥15 手机淘宝抓清除消息接口
  • ¥15 C#无selenium
  • ¥15 LD衰减计算的结果过大
  • ¥15 用机器学习方法帮助保险公司预测哪些是欺诈行为
  • ¥15 计算300m以内的LD衰减
  • ¥15 数据爬取,python
  • ¥15 怎么看 cst中一个面的功率分布图,请说明详细步骤。类似下图
  • ¥15 为什么我的pycharm无法用pyqt6的QtWebEngine
  • ¥15 FOR循环语句显示查询超过300S错误怎么办