iou3344 2023-01-21 19:11 采纳率: 85.2%
浏览 70
已结题

PHP+MYSQL全文索引下的搜索出错问题排查。

SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・交通大学" +"(北京、工业大学)" +"西安(高新区)"' IN BOOLEAN MODE)
SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・" +"北京、工业大学)" +"西安("' IN BOOLEAN MODE)
SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・" +"北京、工业大学" +"西安("' IN BOOLEAN MODE)
SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・" +"北京、工业大学" +"西安"' IN BOOLEAN MODE)

以上sql语句都找不到

SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安" +"北京" +"高新区"' IN BOOLEAN MODE)
SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・" +"北京、" +"西安("' IN BOOLEAN MODE)

以上这两条sql语句则可以找到

全文索引已经重新做过 create fulltext index search_index_fulltext1 on data_1(毕业学校,家庭住址) with parser ngram;
之所以使用ngram分词是因为我的字段内容既有中午也有日文。

在my.ini里面也已添加这一句 ft_stopword_file=E:\phpstudy_pro\Extensions\MySQL8.0.12\share\stopwords.txt

环境是php7.4.3 + mysql8.0.12

通过最后一条成功的sql看,似乎不能说是由于"・ 、( )" 等特殊符号引起的查询错误,但好像又有影响,怎么消除这种影响呢?

因为我最希望用的语句是第一条【 SELECT * FROM data_1 WHERE MATCH (毕业学校,家庭住址) AGAINST ('+"西安・交通大学" +"(北京、工业大学)" +"西安(高新区)"' IN BOOLEAN MODE)】,原因是我的数据结构大多数是这样的,我的搜索条件输入界面的自动完成提示给出的数据也是这样的带括号或带点的。

之所以要用MATCH ...AGAINST的方式查询,是因为毕业学校和家庭住址内的数据有很多空格,不用全文搜索不行,但要用全文搜索又想走索引就只能用这种方式。

也肯定不是字符编码的问题,因为我都确认和确保了数据库和前端查询时都统一使用的是UTF-8编码。

  • 写回答

4条回答 默认 最新

  • 社区专家-Monster-XH 2023-01-21 21:47
    关注

    这个问题可能是由于 MySQL 使用的分词器(ngram)不能正确处理字符串中的特殊符号"・ 、( )"导致的。可能需要使用不同的分词器或者更改分词器的配置来解决这个问题。

    另外,您可以尝试将查询语句中的特殊符号替换为其他字符,例如空格,来消除这种影响。

    另外,您可以使用REPLACE()函数将字符串中的特殊符号替换为其他字符,例如空格。

    SELECT * FROM data_1 WHERE MATCH (REPLACE(毕业学校,'・',' '),REPLACE(家庭住址,'・',' ')) AGAINST ('+"西安 交通大学" +"(北京 工业大学)" +"西安(高新区)"' IN BOOLEAN MODE);

    试试这个语句,看看能不能得到您想要的结果。

    另外,您可以在查询语句中使用LIKE操作符来查找字符串中的特定字符串,而不是使用全文索引。

    最后,您可以在查询语句中使用正则表达式来查找字符串中的特定字符串,而不是使用全文索引。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 1月30日
  • 已采纳回答 1月22日
  • 修改了问题 1月21日
  • 修改了问题 1月21日
  • 展开全部

悬赏问题

  • ¥15 dir815漏洞反弹shell失败
  • ¥15 支付宝小程序云函数登录获取user_id失败
  • ¥50 python for 循环速度慢
  • ¥15 CubeMX生成的代码用keil编译有报错
  • ¥15 Stata链式中介效应代码修改
  • ¥15 latex投稿显示click download
  • ¥15 请问读取环境变量文件失败是什么原因?
  • ¥15 在若依框架下实现人脸识别
  • ¥15 添加组件无法加载页面,某块加载卡住
  • ¥15 网络科学导论,网络控制