德布德 2023-11-30 11:49 采纳率: 76.2%
浏览 7
已结题

c#中有没有比正则表达式效率更高的匹配工具或文本查找工具

我用c#来处理word文档,需要查找出固定样式的“段落”,当文档页数较少的时候,正则表达式效率勉强还可以接受,但是当页数增加至几十页后,匹配效率大幅下降。
因此我想询问各位大拿,是否有更高效的匹配工具?

此外,我曾想用c# 中 Microsoft.Office.Interop.Word 中的find,一次性找出所有匹配段落,直观上感觉可能会效率更高一些,因为不用循环遍历每个段落,但是后来发现只用通配符基本没法实现,因为我要查找的是以段落为单位的文本,但是通配符无法直接查找以段落为单位的文本,例如我有两级标题。
1 这是一级标题
1.1 这是二级标题
直接用通配符查找标题1,会同时找出“1 这是一级标题”和“1 这是二级标题”。
如果直接通过查找筛选出符合要求的段落,我感觉也是个不错的选择,不知道各位大拿对这个是否也有些好的建议?

  • 写回答

1条回答 默认 最新

  • threenewbee 2023-11-30 12:05
    关注

    正则表达式之所以效率比较低,主要是为了追求通用性,如果你要更高的效率,就自己写专用的匹配程序。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月18日
  • 已采纳回答 12月10日
  • 创建了问题 11月30日