题目如下:
当前用户关注数据格式为
a|b|2016-10-01 00:00:01
b|a|2016-10-01 07:00:01
a|c|2016-10-02 00:00:01
d|a|2016-10-03 00:00:01
....
a|b表示a关注了b,b|a表示b关注了a,这种叫相互关注
请使用mapreduce程序
(1)计算列出所有相互关注的数据
(2)计算所有回粉数,比如根据时间,a先关注了b,b然后才关注了a,表示b回粉了a,b的回粉数为1,依次类推
(3)假设上述数据的字段为uid|fid|createtime,请用sql写出上述第(1)(2)题答案
mapreduce编程面试题,计算社交数据中的关注回粉数
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
1条回答 默认 最新
simensk 2024-04-22 12:25关注-- (1) 计算列出所有相互关注的数据
SELECT a.*
FROM your_table a
JOIN your_table b ON a.uid = b.fid AND a.fid = b.uid;-- (2) 计算所有回粉数
SELECT fid, COUNT(DISTINCT uid) AS followers
FROM your_table
GROUP BY fid;解决 无用评论 打赏 举报