目前遇到一个相对小繁琐的问题:工作方面,想从繁多的聊天记录中, 分析其中提到的所有的 地域地区名称(只需要在所在的某个具体城市里,判断是否提及到 城市中的:小区名,街道名,区域名等),若提到,则记录下来具体名称。
目前也在研究了部分思路,目前很多是根据 目前网络上有的 分词系统【例如:bosonnlp、腾讯开放api的句法分析API等】,有的会自动分析其地域名,但是机器不准确。
想问问看这里的大师级人物有没有什么推荐和 知识体系结构的指导思想,我确实没有头绪,想被指点指点。
目前有的思路,就是分词匹配,因为是针对某个对应的区域内的 小区名和街道名 ,所以应该在地图api内 会能得到这些地名的词库,
当检索匹配后,则记录在搜索文本中的位置。
请问大师们,有木有好一点的思路,请简单描述下,我好一一学习,从而解决我的问题。
或者我上面说到得方法有可行性,能否也简单描述下。我查了下 ,HanLP 这个国内的分词检索系统还不错,不过还没学习,因为整个项目系统是搭建在php环境中的,hanlp是用java写的,虽然也提供了Solr插件,或许能否通过php调用Solr插件完成(有待确认)
目前是想找到哪种有效的可行性方案,然后注意逐一学习解决。