java实现关于文章相似度问题

CMS项目数据量大多超10w,有的数据量达到100w以上！这种大数据量的情况下如何实现计算每篇文章跟剩余文章的相似度？求大神指教下！之前的做法是先把所有数据从数据库查出来，放在List里边，然后遍历循环跟剩余的对比，尴尬的是数据量一大直接卡死

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
来临 2018-02-28 09:16
关注
你这应该使用算法或文本分析工具，比如使用Ansj分词工具等等，这样效率会很高，上传的文档可以离线比对后保存相似结果，查询时直接查询结果这不就快了

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Java 比较两张图片的相似度 java 图像处理
2022-10-18 00:56

回答 1 已采纳可以考虑基于openCV来做图片相似性的比较，可以参考这篇博文来实现。写得比较清楚：https://blog.csdn.net/u014775579/article/details/123534770
Java的lire大佬们能给个测相似度的例子吗？ hibernate jar java maven spring
2019-09-30 19:33

回答 1 已采纳 http://outofmemory.cn/code-snippet/33851/Lire-picture-search-example-with-Lucene
基于内容的推荐算法的Java源码。 java
2019-05-15 20:56

回答 1 已采纳 https://download.csdn.net/download/duck_arrow/10297540 拿走不谢
余弦相似性获取文章相似度的java实现
2015-07-14 17:35

余弦相似性获取文章相似度的java实现,tf-idf算法实现
高分悬赏：Java语言判断字符串的相似度的程序的算法的思想是什么呢开发语言
2020-07-02 17:07

回答 2 已采纳有一个相关的算法 Levenshtein Distance，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符
将获取到的地址信息跟Excle表中的所有地址信息做相似度计算 java python 开发语言
2021-07-27 11:16

回答 4 已采纳 # -*- coding: utf-8 -*- import jieba import numpy as np import re def get_word_vector(s1,s2):
C#难，java难？职场和发展
2022-07-31 16:36

回答 3 已采纳年龄比较小的话从C类语言学起吧，可以更好地理解底层的逻辑，对以后的学习都会有帮助的哟
JAVA-计算两篇文章的相似度
2022-10-10 10:37

囧囧君的博客 JAVA-计算两篇文章的相似度
关于matlab的问题 matlab
2023-03-30 19:42

回答 4 已采纳我引用ChatGPT作答：大概这样呢？不知道行不行。 lamd=0.193*10^-3; % 入射波长 w=1.5; % 入射光束腰 R=1.5; % 元件的极限孔径 D=175*10^-3; %
问题 A: 【提高】字符串的相似度 c++ c语言
2022-01-24 10:43

回答 1 已采纳 #include<stdio.h> #include<string.h> int f(char a[],char b[]) { char tem='#'; in
加密字符串相似度计算 jar 其他
2021-05-29 10:13

回答 1 已采纳 C语言代码如下： #include <stdio.h> #include <string> struct StXypoint { int x; int y; }; //
java文本相似度
2023-08-23 17:04

创客公元的博客在 Java 中，可以使用一些现成的库来比较文本的相似度。这里，我将为您提供一个使用 Jaccard 相似度算法（集合相似度）比较文本相似度的方法。请注意，这个示例仅提供了一个基本的文本相似度比较方法。实际上，有...
请问哪个树结构相似度算法比较准确？
2017-10-27 09:00

回答 1 已采纳将文档目录递归展开成一个字符串，可以用最小编辑距离算法来评估相似性
Java实现标题相似度计算，文本内容相似度匹配，Java通过SimHash计算标题文本内容相似度
2022-02-09 23:24

Hello_World_QWP的博客四、Java通过SimHash计算文本内容相似度代码示例一）、新增依赖包二）、过滤特殊字符三）、计算单个分词的Hash值四）、分词计算向量五）、获取标题内容的海明距离六）、获取标题内容的相似度 七）、...
Java 实现计算文本 相似度 （使用余弦定理）
2020-09-25 17:09

热心网友007的博客 Java实现余弦定理计算文本相似度 相似度度量（Similarity），即计算个体间的相似程度，相似度度量的值越小，说明个体间相似度越小，相似度的值越大说明个体差异越大。对于多个不同的文本或者短文本对话消息要来计算...
没有解决我的问题, 去提问

悬赏问题

¥15 基于卷积神经网络的声纹识别
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题

java实现关于文章相似度问题

4条回答 默认 最新

悬赏问题

4条回答默认最新