地虎降天龙 2016-11-26 01:32 采纳率: 0%
浏览 3396
已结题

小段文本中提取小区名、街道名或者区域名等(指定区域内)

目前遇到一个相对小繁琐的问题:工作方面,想从繁多的聊天记录中, 分析其中提到的所有的 地域地区名称(只需要在所在的某个具体城市里,判断是否提及到 城市中的:小区名,街道名,区域名等),若提到,则记录下来具体名称。

目前也在研究了部分思路,目前很多是根据 目前网络上有的 分词系统【例如:bosonnlp、腾讯开放api的句法分析API等】,有的会自动分析其地域名,但是机器不准确。

想问问看这里的大师级人物有没有什么推荐和 知识体系结构的指导思想,我确实没有头绪,想被指点指点。

目前有的思路,就是分词匹配,因为是针对某个对应的区域内的 小区名和街道名 ,所以应该在地图api内 会能得到这些地名的词库,
当检索匹配后,则记录在搜索文本中的位置。

请问大师们,有木有好一点的思路,请简单描述下,我好一一学习,从而解决我的问题。
或者我上面说到得方法有可行性,能否也简单描述下。我查了下 ,HanLP 这个国内的分词检索系统还不错,不过还没学习,因为整个项目系统是搭建在php环境中的,hanlp是用java写的,虽然也提供了Solr插件,或许能否通过php调用Solr插件完成(有待确认)
目前是想找到哪种有效的可行性方案,然后注意逐一学习解决。

  • 写回答

1条回答 默认 最新

  • 三笑咖啡 2016-11-26 07:16
    关注

    直接开始做就知道可行性,难点就是准确性,聊天记录里地名并不一定是规范的,可能还有错别字

    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器