필!초!cross! 2022-08-07 01:01 采纳率: 100%
浏览 40
已结题

海量用户下的去重问题思考

最近在做类似于探探的划卡功能,实在想不到他们是如何做到海量用户下的去重功能,目前我们的应用两日活50w,想到的只有放入redis布隆过滤器中,但是这样到后期很可能光查询去重,就要操作查询无数次redis,xdm给点意见吧[难过]

  • 写回答

3条回答 默认 最新

  • kakaccys 2022-08-07 07:53
    关注

    我猜测探探的划卡推荐的是先基于geohash对用户的关联用户群初始化的,假设用户A,他的地理信息是geohash的这一区域,这个区域在大数据库里假设有几千人,然后将这几千人和A的兴趣标签计算进行排序,就初始化了A的顺序人群卡片列表,这样就不存在去重问题了,A除非把这几千人或者几万人都划完,才可能再次启动算法,即找到这个geohash区域旁边格子的人,再生成一个顺序人群卡片列表

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月15日
  • 已采纳回答 8月7日
  • 创建了问题 8月7日

悬赏问题

  • ¥15 centos7.9 IPv6端口telnet和端口监控问题
  • ¥120 计算机网络的新校区组网设计
  • ¥20 完全没有学习过GAN,看了CSDN的一篇文章,里面有代码但是完全不知道如何操作
  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 海浪数据 南海地区海况数据,波浪数据
  • ¥20 软件测试决策法疑问求解答
  • ¥15 win11 23H2删除推荐的项目,支持注册表等
  • ¥15 matlab 用yalmip搭建模型,cplex求解,线性化处理的方法
  • ¥15 qt6.6.3 基于百度云的语音识别 不会改
  • ¥15 关于#目标检测#的问题:大概就是类似后台自动检测某下架商品的库存,在他监测到该商品上架并且可以购买的瞬间点击立即购买下单