5

如何抽取TXT中的特定格式文本内容?

图片说明
我手上有一篇语料,我想抽取语料中<目录>和<篇名>后面的内容,语料内容如上图所示。最后希望得到的结果格式是类似于:<目录>卷之一治诸风<篇名>透冰丹。该如何实现?我是编程小白,希望大牛们辛苦给下代码注释。

查看全部
weixin_42282277
weixin_42282277
2020/04/08 14:54
  • python
  • 正则表达式
  • 自然语言处理
  • 数据挖掘
  • 点赞
  • 收藏
  • 回答
    私信
满意答案
查看全部

2个回复