list里面都是处理过后的 url 组成的
RDD[(String, List[(String, String)])]
user1,list((u1,u2),(u2,u3),(u3,u4),(u4,u5),(u5,u6),(u6,u7)....)
user2,list((k1,k2),(k2,k3),(k3,k4),(k4,k5),(k5,k6),(k6,k7)....)
user3,list((m1,m2),(m2,m3),(m3,m4),(m4,m5),(m5,m6),(m6,m7)....)
.......
user1 与 user2比较,取top(n)
(u1,u2) 在 user2中出现了 i 次
(u2,u3) j 次
(u3,u4) k 次
(u4,u5) l 次
........ .
user1 与 user3比较,取top(n)
......
..
..
user2 与其它用户比较取top(n)
user3 与其它用户比较取top(n)
user4 与其它用户比较取top(n)
user5 与其它用户比较取top(n)
.....
以此类推,将其他用于两两比较取 top(n)
各位大神,这个怎么实现啊,scala刚学,弄了一天都没解决,求详细代码,谢谢