文本挖掘,化学符号都是一个大写加一个小写(或者没有)的情况,用自己写的和网上那些表达式,不可避免地或匹配到每一句开头的单词,有没有什么改进的正则表达式写法。或者从自然语言处理的方向出发,有装wordnet语料库,但是不太会用,这里面有没有方法可以识别出化学符号。烦请各位大佬指点一二。。。。
1条回答 默认 最新
- MFine 2020-05-09 23:32关注
你连化学符号的特征,都没准确认知,怎么可能正确提取。最简单的就是把几百个化学符号做个列表,或字典。再考虑其他的,不要动不动,就什么语料库,专业的化学符号词很少的吧。
解决 无用评论 打赏 举报