xiaowei_so 2017-02-18 13:24 采纳率: 0%
浏览 867

mapreduce编程面试题,计算社交数据中的关注回粉数

题目如下:
当前用户关注数据格式为
a|b|2016-10-01 00:00:01
b|a|2016-10-01 07:00:01
a|c|2016-10-02 00:00:01
d|a|2016-10-03 00:00:01
....
a|b表示a关注了b,b|a表示b关注了a,这种叫相互关注
请使用mapreduce程序
(1)计算列出所有相互关注的数据
(2)计算所有回粉数,比如根据时间,a先关注了b,b然后才关注了a,表示b回粉了a,b的回粉数为1,依次类推
(3)假设上述数据的字段为uid|fid|createtime,请用sql写出上述第(1)(2)题答案

  • 写回答

1条回答 默认 最新

  • simensk 2024-04-22 12:25
    关注

    -- (1) 计算列出所有相互关注的数据
    SELECT a.*
    FROM your_table a
    JOIN your_table b ON a.uid = b.fid AND a.fid = b.uid;

    -- (2) 计算所有回粉数
    SELECT fid, COUNT(DISTINCT uid) AS followers
    FROM your_table
    GROUP BY fid;

    评论

报告相同问题?

悬赏问题

  • ¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场 部分对应不上
  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?