weixin_48484941 2021-08-20 12:43 采纳率: 62.5%
浏览 13
已结题

spark中的rdd还能查数据么

需求大概是list和list对比,然后过滤出重叠部分,不希望用 笛卡儿积 ,因为数据量大的时候,非常的慢,希望用filter去过滤。所以想问下rdd中能不能实现:再去过滤一下数据。
大致逻辑如下:会提示SparkContext没有序列化的。不知道还有没有什么方式可以实现
img

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 8月28日
    • 创建了问题 8月20日

    悬赏问题

    • ¥60 求一个简单的网页(标签-安全|关键词-上传)
    • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
    • ¥15 基于卷积神经网络的声纹识别
    • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
    • ¥100 为什么这个恒流源电路不能恒流?
    • ¥15 有偿求跨组件数据流路径图
    • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
    • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
    • ¥15 一直显示正在等待HID—ISP
    • ¥15 Python turtle 画图