文本相似度分析的性能检测？

利用tf-idf算法和余弦相似度算法计算了文本之间的相似度，可是结果出来了，不知道结果的好坏啊，请问大神们有没有知道怎么评测结果的好坏啊？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2015-04-23 10:24
关注
分析算法复杂度。如果算法太复杂，分析起来有困难，评价算法的好坏就是给数据量大小不等的测试样本，运行得到耗费的时间。
对数据量和运行时间的曲线拟合。
糟糕的算法就是随着数据量的增加，时间或者存储的开销呈现几何级数地发散出去。
好的算法是，时间随着数据的增加，呈现常数、收敛在某个值或者是线性增加的。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问哪个树结构相似度算法比较准确？
2017-10-27 09:00

回答 1 已采纳将文档目录递归展开成一个字符串，可以用最小编辑距离算法来评估相似性
Java的lire大佬们能给个测相似度的例子吗？ hibernate jar java maven spring
2019-09-30 19:33

回答 1 已采纳 http://outofmemory.cn/code-snippet/33851/Lire-picture-search-example-with-Lucene
文本相似度计算时需要对文件夹每一个文件分别计算 python
2023-02-23 15:13

回答 3 已采纳首先standardization(filename)函数，需要传入的的是一个文件路径，如下面代码的filename def standardization(filename): data='
自然语言处理中的文本相似度分析：算法与实现
2023-06-29 04:26

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术《自然语言处理中的文本相似度分析：算法与实现》引言 1.1. 背景介绍自然语言处理（Natural Language Processing, NLP）是研究人类语言的
从facebook和twitter朋友那里找到相似度得分的算法？ php twitter
2013-04-24 04:34

回答 1 已采纳 You may want to consider the vector space model: represent each name and location as a dimension i
文本向量相似度不理想 bert python 深度学习
2023-04-14 09:28

回答 1 已采纳 BERT 是一种预训练语言模型，它的预训练目标是使用大量的未标记的文本数据来训练出语言表达能力更强的表示。但是，BERT 并不是一个直接用于文本相似度计算的模型，需要经过微调或 fine-tuning
主题词是由于语义相关性高还是语义相似度大？聚类
2022-12-12 11:56

回答 2 已采纳望采纳两者都有，在主题分析中，一组词语被认为属于同一个主题主要是基于它们的相似度和相关性。主题分析是一种自然语言处理技术，它的目的是找出文本中的主题，并将文本分组为不同的主题。在进行主题分析时，算法会
文本相似度
2023-01-10 15:20

sunghosts的博客 tune在文本表征和文本匹配任务取得了不错的性能缺点：BERT自身导出的句向量（不经过Fine-tune，对所有词向量求平均）质量较低，甚至比不上Glove的结果，因而难以反映出两个句子的语义相似度 主要原因是： 1.BERT对...
libpcap和winpcap语法相似度高吗？ wireshark
2014-12-09 06:11

回答 2 已采纳 2种相似， http://blog.csdn.net/sansecao/article/details/4377834
python文本中出现的词汇关联性分析 python
2022-09-27 16:51

回答 1 已采纳可以参考： https://www.jianshu.com/p/c4f
加密字符串相似度计算 jar 其他
2021-05-29 10:13

回答 1 已采纳 C语言代码如下： #include <stdio.h> #include <string> struct StXypoint { int x; int y; }; //
基于词向量和卷积神经网络的文本相似度计算
2019-01-10 16:24

Not丶Perfect的博客基于CNN和词向量的文本相似度分析 1. 前言众所周知，现在的时代就是海量数据暴增的时代，每天的各种聊天工具和数以亿计的网页产生了海量的人工无法高效处理的各种文字信息。由此而生，我们自然想到通过分类来减少...
图像相似度检测都可以用啥方法，具体程序呢 c++ c语言 matlab 有问必答
2021-06-28 20:28

回答 3 已采纳参考一下：https://gist.github.com/Mainvooid/a0f76ac05aa4119c2d12e7c8919fdada 如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮
文本相似度详解
2024-01-25 19:09

架构未来的博客 7. **基于深度学习的相似度比对**：使用深度学习模型（如循环神经网络RNN、长短期记忆网络LSTM、Transformer等）来学习文本的深层表示，然后基于这些表示进行相似度计算。6. **语义相似度**：不仅考虑文本的表面形式...
预训练模型应用工具 PaddleHub情感分析、对话情绪识别文本相似度
2020-07-30 20:56

stay_foolish12的博客文章目录1. 预训练模型的应用背景1.1 多任务学习与迁移学习1.2 自监督学习2. 快速使用PaddleHub2.1 通过Python代码调用方式使用PaddleHub2.1.1 CV任务原图展示人像扣图人体部位分割人脸检测关键点检测2.1....
没有解决我的问题, 去提问

悬赏问题

¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 运筹学排序问题中的在线排序
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛