我用c#来处理word文档,需要查找出固定样式的“段落”,当文档页数较少的时候,正则表达式效率勉强还可以接受,但是当页数增加至几十页后,匹配效率大幅下降。
因此我想询问各位大拿,是否有更高效的匹配工具?
此外,我曾想用c# 中 Microsoft.Office.Interop.Word 中的find,一次性找出所有匹配段落,直观上感觉可能会效率更高一些,因为不用循环遍历每个段落,但是后来发现只用通配符基本没法实现,因为我要查找的是以段落为单位的文本,但是通配符无法直接查找以段落为单位的文本,例如我有两级标题。
1 这是一级标题
1.1 这是二级标题
直接用通配符查找标题1,会同时找出“1 这是一级标题”和“1 这是二级标题”。
如果直接通过查找筛选出符合要求的段落,我感觉也是个不错的选择,不知道各位大拿对这个是否也有些好的建议?