银河小分队 2022-07-05 18:13 采纳率: 0%
浏览 25

Elasticsearch大数据怎么去重

Elasticsearch大数据下怎么去重?

目前Elasticsearch集群中索引中有7亿条数据,1Tb,字段10个,要求对账号字段进行去重,返回全部的不重复账号。
使用Filnk或者spark全量扫描数据,对于集群压力太大,请问有别的方法吗

  • 写回答

1条回答 默认 最新

  • 三千烦恼丝xzh 2022-07-06 08:32
    关注

    管道预处理,reindex一个去重字段为ID的索引

    评论

报告相同问题?

问题事件

  • 创建了问题 7月5日