如何抽取TXT中的特定格式文本内容？

图片说明
我手上有一篇语料，我想抽取语料中<目录>和<篇名>后面的内容，语料内容如上图所示。最后希望得到的结果格式是类似于：<目录>卷之一治诸风<篇名>透冰丹。该如何实现？我是编程小白，希望大牛们辛苦给下代码注释。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
bj_0163_bj 2020-04-09 09:26
关注
str1='<目录>卷之一治诸风<篇名>透冰丹内容：治一切风毒……<目录>卷之一治诸风<篇名>龙脑天麻煎内容：治……' import re txt1=re.findall('<目录>(.*?)<篇名>(.*?)内容',str1) for txt in txt1: print(txt)

下面是输出，第一个是目录，第二个是篇名：
('卷之一治诸风', '透冰丹')
('卷之一治诸风', '龙脑天麻煎')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

中文实体提及抽取方法
2025-10-19 04:37

本文介绍了一种名为Un-MenEx的无监督中文实体提及...随着互联网数据的不断增长和人工智能技术的不断进步，Un-MenEx方法在未来的应用前景将非常广阔，能够为信息抽取、文本挖掘、知识图谱构建等多个领域的发展作出贡献。
智能文本抽取技术：精准识别、定位并提取出关键信息
2025-07-31 21:48

智能图像文字识别OCR的博客在信息爆炸的时代，海量的文本数据蕴藏...文本抽取技术正是解决这一难题的核心利器。它如同一位训练有素的“信息矿工”，能够深入非结构化或半结构化的文本“矿藏”，精准识别、定位并提取出用户感兴趣的特定信息片段。
人工智能技术在IT书籍内容创作中的应用.pptx
2024-06-01 09:46

### 人工智能技术在IT书籍内容创作中的应用 #### 自然语言生成 - **技术原理**：自然语言生成（NLG）是一种将数据转化为人类可读文本的技术，它依赖于先进的算法来实现。在IT书籍创作过程中，NLG可以通过信息抽取...
DeepEE：基于深度学习的中文事件抽取开源算法汇总库
2025-08-13 01:35

深度学习技术在自然语言处理领域的应用已经取得了显著的成果，其中中文事件抽取是当前人工智能研究中的一个重要分支。事件抽取旨在从非结构化的文本数据中自动识别出特定的事件，并提取出事件的类型、涉及的角色以及...
AI 在文档处理中的应用：从文本抽取到智能摘要生成
2025-08-06 19:23

程序员威哥的博客随着人工智能（AI）技术的发展，尤其是自然语言处理（NLP）领域的突破，文档处理的方式已经发生了巨大的变化。传统上，文档处理需要人工手动阅读、整理和提取信息，而随着AI的加入，文档的自动化处理和智能化分析...
基于Python的上市公司年报智能分析系统：PDF文本转换、停用词过滤与关键词提取方法
2026-01-17 20:14

本项目聚焦于运用人工智能方法对上市公司年度财务报告进行深度解析，重点在于将非结构化的PDF文档转化为可供分析的文本数据，并实施一系列自然语言处理步骤以提取核心信息。具体流程包括文档格式转换、文本清洗、...
基于指针标注的中文医学文本实体关系抽取研究.zip
2025-06-21 17:32

指针标注是一种在自然语言处理中常用的方法，尤其是在实体关系抽取中。...随着人工智能技术的不断发展，尤其是深度学习在自然语言处理中的应用日益广泛，类似的研究成果将有助于推动医疗行业的知识发现和技术创新。
【文本信息抽取与结构化】详聊文本的结构化【下】
2021-01-20 11:52

处理后的文本通常会被转化为类似JSON的结构，每个对象代表文本中的一个部分，包含内容、位置、字体和大小等信息，为信息抽取提供基础。在信息抽取阶段，我们需要根据预先定义好的需求，从结构化的文本中精准地提取...
探秘：AI 如何提取文件内容？jboltai 给出答案
2025-06-09 09:41

细胞派的博客在数字化信息爆炸的时代，文件内容提取已成为...那么，AI 究竟是如何施展其神奇魔力，从各种格式的文件中精准提取内容的呢？本文将深入探讨 AI 文件内容提取技术，并着重介绍 jboltai 在这一领域的卓越功能与创新应用。
文本信息抽取：从非结构化数据中提取知识
2024-05-02 01:07

光子AI的博客 1. 背景介绍随着互联网和数字化时代的到来，我们生活在一个信息爆炸的时代。每天都有海量的文本数据产生，...因此，如何从这些非结构化文本数据中自动提取出有用的信息和知识，成为了自然语言处理领域的一个重要研究方
没有解决我的问题, 去提问

如何抽取TXT中的特定格式文本内容？

2条回答 默认 最新

2条回答默认最新