m0_61742809 2022-12-05 13:10 采纳率: 42.9%
浏览 19

java的输入输出,求取字符串相似度

每行11列,以分号作为分隔符,第1列是userID,第2-10列是与该用户最相似的10个用户的userID,按相似度值从大到小排列,其中相似度是通过review.txt中的前两列计算得到的Jaccard index值。该文件中不同行之间的顺序,按照第1列的userID从小到大排列。注:如果没有使用多线程实现扣5分,如果没有按相似度从大到小排列扣5分。

我的思路是就是计算每一个uid和其他uid的相似度,但是这样子内存根本就不够,全部计算出来后对他们排序为很离谱,所以有没有什么比较好的思路是我可以不用把每一个id 和其他的都算一遍相似度,直接可以找到前10的方法

  • 写回答

1条回答 默认 最新

  • 於黾 2022-12-05 13:51
    关注

    使用排序函数,然后传入计算公式,不要自己循环遍历

    评论

报告相同问题?

问题事件

  • 创建了问题 12月5日

悬赏问题

  • ¥15 react-diff-viewer组件,如何解决数据量过大卡顿问题
  • ¥20 遥感植被物候指数空间分布图制作
  • ¥15 安装了xlrd库但是import不了…
  • ¥20 Github上传代码没有contribution和activity记录
  • ¥20 SNETCracker
  • ¥15 数学建模大赛交通流量控制
  • ¥15 为什么我安装了open3d但是在调用的时候没有报错但是什么都没有发生呢
  • ¥50 paddleocr最下面一行似乎无法识别
  • ¥15 求某类社交网络数据集
  • ¥15 靶向捕获探针方法/参考文献