沫林 2022-06-01 09:12 采纳率: 25%
浏览 20

从百万级数据量中查重

最近打算在起点写个小说,然而起了很多次书名都被告知重复,我不禁想到一个问题:起点的书不管有没有签约数量起码在上百万本,但是在判断重复的时候只用到不到1秒的时间,这么短的时间起点是怎么这么快就反馈给我书名重复的?还是腾讯的一些游戏,比如DNF还有CF,也有名称查重判断,用时也都特别短,而且腾讯游戏的玩家数量级更加恐怖,那腾讯又是怎么在这么短的时间里提示我名称重复的呢?

  • 写回答

1条回答

      报告相同问题?

      相关推荐 更多相似问题

      问题事件

      • 创建了问题 6月1日

      悬赏问题

      • ¥15 uniapp实现钉钉【发起审批实例】上传文件到钉盘,后端为C#.Net处理
      • ¥15 求深信服VDI基准测试工具Sangfor DTP
      • ¥20 使用python中pandas进行数据分析
      • ¥20 使用python中pandas进行数据分析
      • ¥15 导入数据,并且以utf-8为编码格式,但是以上代码报错,求解答
      • ¥15 关于#游戏程序#的问题:端 玩wy服务器10几分钟闪退一次没有任何提示,连启动器一起闪退 本人电脑5800h 3060 16运内 win11 求解答
      • ¥15 做一个手游私服需要什么条件?
      • ¥15 关于企业微信,调用官方 微盘api 时候access_token过期的问题?
      • ¥15 请问这个C语言代码的界面怎样修改
      • ¥15 QT for Android 开发的App后台切换后卡死,没有响应