题目如下:
当前用户关注数据格式为
a|b|2016-10-01 00:00:01
b|a|2016-10-01 07:00:01
a|c|2016-10-02 00:00:01
d|a|2016-10-03 00:00:01
....
a|b表示a关注了b,b|a表示b关注了a,这种叫相互关注
请使用mapreduce程序
(1)计算列出所有相互关注的数据
(2)计算所有回粉数,比如根据时间,a先关注了b,b然后才关注了a,表示b回粉了a,b的回粉数为1,依次类推
(3)假设上述数据的字段为uid|fid|createtime,请用sql写出上述第(1)(2)题答案
mapreduce编程面试题,计算社交数据中的关注回粉数
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- simensk 2024-04-22 12:25关注
-- (1) 计算列出所有相互关注的数据
SELECT a.*
FROM your_table a
JOIN your_table b ON a.uid = b.fid AND a.fid = b.uid;-- (2) 计算所有回粉数
SELECT fid, COUNT(DISTINCT uid) AS followers
FROM your_table
GROUP BY fid;解决 无用评论 打赏 举报
悬赏问题
- ¥15 逻辑谓词和消解原理的运用
- ¥15 请求分析基于spring boot+vue的前后端分离的项目
- ¥15 三菱伺服电机按启动按钮有使能但不动作
- ¥15 js,页面2返回页面1时定位进入的设备
- ¥200 关于#c++#的问题,请各位专家解答!网站的邀请码
- ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
- ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
- ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
- ¥20 腾讯企业邮箱邮件可以恢复么
- ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?