python re表达式问题

我正在学习python
我有两个列表，essay_info 里面装的是文章的表头信息，包括文章标题，作者，章节（当然也可能是没有章节的），另外一个列表 essay_link里面装的与essay_info 中对应的文章链接，如下

essay_info = ["【文章111】第1章 【作者：aa】","【文章111】第2章 【作者：aa】",
    "【文章1】续写1章 【作者：bb】","【文章1】续写2章 【作者：bb】",
              "【文章1】续写83章 【作者：bb】","【文章2】(18-23) 【作者：zhangsan】",
              "【文章2】(1-18) 【作者：zhangsan】","【文章3】（08-16）【作者：Pierrot】",
              "【文章3】（01-08）【作者：Pierrot】","【文章4】（上）【作者：李四】","【文章4】（中）【作者：李四】",
              "【文章4】（下）【作者：李四】",
              "【文章07】【作者：王五】","【文章09】(全文+番外)【作者：王六】","【文章08】(全文)【作者：王七】",
              "【文章08】(番外)【作者：王六】"
              ,"【文章10】(01)【作者：test01】","【文章10】(02)【作者：test01】","【文章12】(卷一1-8)【作者：test02】",
              "【文章12】(卷一8-10)【作者：test02】","【文章12】(卷二1-8)【作者：test02】",
              "【文章12】(卷二8-10)【作者：test02】"]
essay_link = ["www.xxx01.com","www.xxx02.com","www.xxx03.com","www.xxx04.com","www.xxx05.com","www.xxx06.com","www.xxx07.com",
              "www.xxx08.com","www.xxx09.com","www.xxx010.com","www.xxx015","www.xxx016","www.xxx017","www.xxx020","www.xxx016","www.xxx017","www.xxx020"
              ,"www.xxx021","www.xxx022","www.xxx021","www.xxx022","www.xxx021","www.xxx022"]

我想要定义一个字典，键是文章的标题，值是一个列表，把这篇文章的章节和连接都放进去，但是正如你所见，essay_info 里面的内容是杂乱无章的，虽然我们人一眼就能看出哪些哪些内容是同一章，但是它没有规律，于是我定义了如下的规则来找到目标：
title来找到文章的标题，chapter来找到章节，author来找到作者，

def parse_info(info, link):
    title = re.search(r"【(.*?)】", info).group(1)
    chapter = re.findall(r"卷.\d+-\d+|卷.\(\d+\)|[上中下]|续写\d+章|全文\+番外|全文|番外|\(\d+\)|第\d+章", info) or ['全文']
    author = re.search(r"【作者：(.*?)】", info).group(1)
    return author, title, [(chap, link) for chap in chapter]

接着对章节进行排序，这样才符合我们的期望：

def sort_chapters(chapters):
    return sorted(chapters, key=lambda x: (int(x[0][2:].split('-')[0]) if '卷' in x[0] else (int(x[0].split('-')[0]) if '-' in x[0] else (int(x[0][2:-1]) if '续写' in x[0] else (int(x[0][1:-1]) if '(' in x[0] else (int(x[0][1:-1]) if '第' in x[0] else {'上': 0, '中': 1, '下': 2, '全文': 3, '全文+番外': 4, '番外': 5}[x[0]]))))))

接着输出，问题就出现了

[aa]：[文章111]，[第81章]，[www.xxx01.com]
[aa]：[文章111]，[第82章]，[www.xxx02.com]
[bb]：[文章1]，[续写81章]，[www.xxx03.com]
[bb]：[文章1]，[续写82章]，[www.xxx04.com]
[bb]：[文章1]，[续写83章]，[www.xxx05.com]
[zhangsan]：[文章2]，[全文]，[www.xxx06.com]
[zhangsan]：[文章2]，[全文]，[www.xxx07.com]
……
……
[test02]：[文章12]，[卷一1-8]，[www.xxx022]
[test02]：[文章12]，[卷二1-8]，[www.xxx022]
[test02]：[文章12]，[卷一8-10]，[www.xxx021]
[test02]：[文章12]，[卷二8-10]，[www.xxx021]

其中的“[zhangsan]：[文章2]，[全文]，[链接]，[zhangsan]：[文章2]，[全文]，[链接]”，
我希望它输出的应该是：“[zhangsan]：[文章2]，[1-8]，[链接]，[zhangsan]：[文章2]，[08-16]，[链接]”，
可以看到寻找的表达式已经复杂了，我该如何修改表达式或者是否有更加简单的方法来处理这种情况呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-05-10 19:05
关注
使用Python的re模块进行正则匹配，将相关联的信息从essay_link中提取出来，并与essay_info对应。

以上回复有部分引自免费微信小程序：皆我百晓生。如问题尚未解决，还请稍待，如有疑问请回复进一步沟通。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python正则表达式和re模块详解.pdf
2024-12-21 16:43

在编程语言中，Python的re模块提供了对正则表达式的支持。正则表达式由普通字符和元字符构成。普通字符包括大小写字母、数字，用于匹配字符串中的自身。而元字符则包括了一些特殊的符号，比如[abc]可以匹配a、b或c...
【编程语言：Python】Python正则表达式详解：语法、模块函数及实战案例解析
2025-04-08 08:18

适合人群：具有Python编程基础，希望深入理解和应用正则表达式的开发人员。使用场景及目标：①学习正则表达式的基本语法和元字符，掌握其在字符串匹配、搜索、替换中的应用；②理解并运用re模块中的常用函数，如re....
Python正则表达式基础
2022-04-02 16:46

Python正则表达式是Python编程语言中的一个强大工具，用于处理和分析文本字符串。它允许开发者通过模式匹配来查找、替换或提取数据，广泛应用于数据清洗、文本挖掘、日志分析等领域。在Python中，正则表达式主要通过...
Python正则表达式详解[项目源码]
2025-11-12 16:50

在Python编程语言中，正则表达式是一种强大的文本处理工具，它允许用户进行复杂的字符串搜索和文本匹配。本文通过深入介绍Python中的re模块，系统阐述了正则表达式的核心概念和应用场景。首先，文章阐述了正则...
Python正则表达式详解[源码]
2025-11-12 16:29

在Python中，正则表达式功能主要通过内置的re模块来实现。首先，基本匹配规则是正则表达式的基础，它涉及到匹配单个字符或一组字符。在Python的re模块中，可以使用点号"."来匹配任意单个字符（除了换行符），而方...
Python正则表达式全解析：深入探索re模块
2024-11-24 11:31

Python正则表达式是编程中一种用于模式匹配和文本分析的强大工具，它在文本处理、数据清洗、日志分析等多个领域都有广泛的应用。Python标准库中的re模块为开发者提供了使用正则表达式进行字符串匹配、提取和替换等...
python利用正则表达式搜索单词示例代码
2021-01-01 09:05

在python中，通过内嵌集成re模块，程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码，然后由用C编写的匹配引擎执行。比如下面的例子，就是用来从一段文字里查找一个单词，如下：示例...
详解Python正则表达式re模块
2020-09-19 13:00

在Python编程中，正则表达式是一个非常强大的工具，用于文本处理和字符串操作。Python中的`re`模块提供了支持正则表达式的各种功能。本文将详细介绍`re`模块的核心功能及其使用方法，并通过具体的示例代码帮助读者更...
编程语言Python正则表达式详解：常用函数与模式匹配在文本处理中的应用
2025-06-13 10:53

文章首先介绍了Python自1.5版本起引入的re模块，该模块提供了Perl风格的正则表达式支持。接着讲解了re模块的核心函数，如`compile`、`match`、`search`、`sub`、`findall`、`finditer`和`split`等，并通过实例演示了...
师傅带徒弟学：Python正则表达式
2021-06-09 20:10

Python中正则表达式应用非常广泛，如:数据挖掘、数据分析、...Python也提供了re模块利用正则表达式实现文本的匹配、查找和替换等操作。本章介绍正则表达式，注意本章介绍的正则表达式与其他的语言正则表达式是通用的。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月10日

python re表达式问题

2条回答 默认 最新

问题事件

2条回答默认最新