xiaowei_so 2017-02-18 13:24 采纳率: 0%
浏览 867

mapreduce编程面试题,计算社交数据中的关注回粉数

题目如下:
当前用户关注数据格式为
a|b|2016-10-01 00:00:01
b|a|2016-10-01 07:00:01
a|c|2016-10-02 00:00:01
d|a|2016-10-03 00:00:01
....
a|b表示a关注了b,b|a表示b关注了a,这种叫相互关注
请使用mapreduce程序
(1)计算列出所有相互关注的数据
(2)计算所有回粉数,比如根据时间,a先关注了b,b然后才关注了a,表示b回粉了a,b的回粉数为1,依次类推
(3)假设上述数据的字段为uid|fid|createtime,请用sql写出上述第(1)(2)题答案

  • 写回答

1条回答 默认 最新

  • simensk 2024-04-22 12:25
    关注

    -- (1) 计算列出所有相互关注的数据
    SELECT a.*
    FROM your_table a
    JOIN your_table b ON a.uid = b.fid AND a.fid = b.uid;

    -- (2) 计算所有回粉数
    SELECT fid, COUNT(DISTINCT uid) AS followers
    FROM your_table
    GROUP BY fid;

    评论

报告相同问题?

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵