xiaowei_so 2017-02-18 13:24 采纳率: 0%
浏览 867

mapreduce编程面试题,计算社交数据中的关注回粉数

题目如下:
当前用户关注数据格式为
a|b|2016-10-01 00:00:01
b|a|2016-10-01 07:00:01
a|c|2016-10-02 00:00:01
d|a|2016-10-03 00:00:01
....
a|b表示a关注了b,b|a表示b关注了a,这种叫相互关注
请使用mapreduce程序
(1)计算列出所有相互关注的数据
(2)计算所有回粉数,比如根据时间,a先关注了b,b然后才关注了a,表示b回粉了a,b的回粉数为1,依次类推
(3)假设上述数据的字段为uid|fid|createtime,请用sql写出上述第(1)(2)题答案

  • 写回答

1条回答 默认 最新

  • simensk 2024-04-22 12:25
    关注

    -- (1) 计算列出所有相互关注的数据
    SELECT a.*
    FROM your_table a
    JOIN your_table b ON a.uid = b.fid AND a.fid = b.uid;

    -- (2) 计算所有回粉数
    SELECT fid, COUNT(DISTINCT uid) AS followers
    FROM your_table
    GROUP BY fid;

    评论

报告相同问题?

悬赏问题

  • ¥15 逻辑谓词和消解原理的运用
  • ¥15 请求分析基于spring boot+vue的前后端分离的项目
  • ¥15 三菱伺服电机按启动按钮有使能但不动作
  • ¥15 js,页面2返回页面1时定位进入的设备
  • ¥200 关于#c++#的问题,请各位专家解答!网站的邀请码
  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?