地虎降天龙 2016-11-26 01:32 采纳率: 0%
浏览 3396
已结题

小段文本中提取小区名、街道名或者区域名等(指定区域内)

目前遇到一个相对小繁琐的问题:工作方面,想从繁多的聊天记录中, 分析其中提到的所有的 地域地区名称(只需要在所在的某个具体城市里,判断是否提及到 城市中的:小区名,街道名,区域名等),若提到,则记录下来具体名称。

目前也在研究了部分思路,目前很多是根据 目前网络上有的 分词系统【例如:bosonnlp、腾讯开放api的句法分析API等】,有的会自动分析其地域名,但是机器不准确。

想问问看这里的大师级人物有没有什么推荐和 知识体系结构的指导思想,我确实没有头绪,想被指点指点。

目前有的思路,就是分词匹配,因为是针对某个对应的区域内的 小区名和街道名 ,所以应该在地图api内 会能得到这些地名的词库,
当检索匹配后,则记录在搜索文本中的位置。

请问大师们,有木有好一点的思路,请简单描述下,我好一一学习,从而解决我的问题。
或者我上面说到得方法有可行性,能否也简单描述下。我查了下 ,HanLP 这个国内的分词检索系统还不错,不过还没学习,因为整个项目系统是搭建在php环境中的,hanlp是用java写的,虽然也提供了Solr插件,或许能否通过php调用Solr插件完成(有待确认)
目前是想找到哪种有效的可行性方案,然后注意逐一学习解决。

  • 写回答

1条回答 默认 最新

  • 三笑咖啡 2016-11-26 07:16
    关注

    直接开始做就知道可行性,难点就是准确性,聊天记录里地名并不一定是规范的,可能还有错别字

    评论

报告相同问题?

悬赏问题

  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥200 uniapp长期运行卡死问题解决
  • ¥15 latex怎么处理论文引理引用参考文献
  • ¥15 请教:如何用postman调用本地虚拟机区块链接上的合约?
  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?
  • ¥15 乘性高斯噪声在深度学习网络中的应用