花星辞. 2024-06-14 08:50 采纳率: 0%

已结题

Hadoop：好友推荐

根据“好友关系.txt”数据，利用Hadoop平台，实现好友推荐与可视化显示。要求:通过MapReduce分析两人是否认识，并推荐为好友。
(1)推荐者和被推荐者一定有一个或多个相同的好友
(2)全局去寻找好友列表中两两关系
(3)统计两两关系出现次数
(4)加载Hbase、Hive等软件，并说明
API
(1)map:按好友列表输出两两关系
(2)reduce:对两两关系进行求和

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

12条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-06-14 08:50

关注

引自免费微信小程序：皆我百晓生

要实现基于Hadoop平台的好友推荐系统，我们可以通过MapReduce框架来处理大量用户的好友关系数据，找出共同好友最多的潜在好友推荐对。下面是一个详细的步骤和代码示例，用于完成这个任务。

步骤 1: MapReduce Job 设计

Mapper

Mapper的输入是用户及其好友列表。Mapper的任务是将每一对可能的好友组合输出，作为键值对（<UserA, UserB>, 1）的形式，其中UserA和UserB都是用户ID。为了确保每个组合只计算一次，可以确保UserA的ID小于UserB的ID。

import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class FriendRecommendationMapper extends Mapper<Object, Text, Text, IntWritable> {
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
        String[] parts = value.toString().split("\t");
        String userId = parts[0];
        String[] friends = parts[1].split(",");
        for (int i = 0; i < friends.length; i++) {
            for (int j = i + 1; j < friends.length; j()) {
                if (friends[i].compareTo(friends[j]) < 0) {
                    word.set(friends[i] + "," + friends[j]);
                } else {
                    word.set(friends[j] + "," + friends[i]);
                }
                context.write(word, one);
            }
        }
    }
}

Reducer

Reducer接收来自Mapper的键值对，对于每个唯一的键（即用户对），它将计算这些键出现的总次数，这代表了两个用户之间共享的朋友数量。

import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class FriendRecommendationReducer extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();

    public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable val : values) {
            sum += val.get();
        }
        result.set(sum);
        context.write(key, result);
    }
}

步骤 2: Hadoop Job 设置

在实际环境中，你需要设置一个Hadoop Job来运行上述Mapper和Reducer。这包括指定输入和输出路径，以及配置Job参数。

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class FriendRecommendationDriver {
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf, "friend recommendation");
        job.setJarByClass(FriendRecommendationDriver.class);
        job.setMapperClass(FriendRecommendationMapper.class);
        job.setReducerClass(FriendRecommendationReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileInputFormat.addInputPath(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));
        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }
}

步骤 3: 使用HBase 或 Hive

完成MapReduce作业后，结果可以存储在HBase中以供实时查询，或者导入到Hive中进行更复杂的SQL查询和分析。

加载到HBase

使用HBase的Put操作将结果写入表中。

加载到Hive

创建一个Hive表并使用LOAD DATA INPATH命令将结果文件加载到Hive表中。

结果可视化

最后，可以使用任何可视化工具（如Tableau、Gephi或自定义Web应用）来展示推荐的好友关系，通常以图形网络的形式展示。

以上代码和步骤应帮助你构建一个基于Hadoop的好友推荐系统。注意，实际部署时需要根据你的Hadoop集群配置和具体需求调整代码和参数。

编辑记录

报告相同问题？

关注问题

基于hadoop的好友推荐系统
2022-04-07 22:31

【标题】"基于Hadoop的好友推荐系统"揭示了如何利用大数据处理框架Hadoop来构建一个高效、可扩展的社交网络中的好友推荐功能。在现代的社交媒体平台中，好友推荐是提升用户粘性和互动性的重要手段，通过分析用户的...
大数据Hadoop学习之——好友推荐
2020-08-21 11:55

江凌的博客 3、好友推荐列表就是按照两个用户的共同好友数量排名二、MapReduce分析 1、分两步MapReduce计算完成； 2、第一步先得到用户的间接好友关系数目，注意有直接好友关系的用户需要过滤掉； 3、第二步根...
基于Hadoop的好友推荐系统.zip
2024-03-13 11:40

基于Hadoop的好友推荐系统是利用AI技术，结合用户行为、兴趣和社交网络关系，来实现个性化的好友推荐。这种系统能够提升用户体验，增加用户粘性，从而提高平台的整体价值。 Hadoop的核心组件包括Hadoop Distributed...
Hadoop课程设计，基于Hadoop的好友推荐，在VM虚拟机上搭建CentOS环境（伪分布式）
2021-06-22 11:43

【标题】：“Hadoop课程设计，基于Hadoop的好友推荐，在VM虚拟机上搭建CentOS环境（伪分布式）”这一主题涵盖了多个IT领域的关键知识点，包括大数据处理框架Hadoop、虚拟化技术VMware、操作系统CentOS以及数据推荐...
《Hadoop权威指南.大数据的存储与分析.第4版.修订版&升级版》
2019-04-30 09:15

水的精神的博客不求回报，只需要一个关注，一句留言，一个点赞，让我知道我也可以帮助别人，更有动力做免积分分享**/ /*如果没有找到，可以加我好友询问一下，是不是还没有分享出来。Q 1210644725**/ /*最后谢谢大家的支持**/ 直接...
深入浅出Hadoop：高效处理大数据
2014-03-24 01:14

hardworkba的博客分享到 ...一键分享QQ空间新浪微博百度云收藏人人网腾讯微博百度相册开心网腾讯朋友百度贴吧豆瓣网...深入浅出Hadoop：高效处理大数据 2011年10月21日15:11 it168网站原创作者：DoubleLife 编辑：皮丽华
基于hadoop的qq推荐好友.zip
2024-03-13 12:29

总结，基于Hadoop的QQ推荐好友项目展示了如何利用大数据技术解决实际问题。通过深入理解Hadoop的分布式文件系统和MapReduce，以及推荐系统的原理和实现，可以为用户提供更智能、个性化的社交体验。在实践中，开发者...
社交网络情感分析：NLP与大数据技术的完美结合
2025-09-07 19:14

Agentic AI人工智能与大数据的博客举个例子：分析100万条微博评论：没有大数据：用单机Python处理，需要72小时（光读取数据就要10小时）；没有NLP：用Spark统计词频，只能得出“‘手机’出现了50万次”，但不知道是“夸手机”还是“骂手机”； ...
《深入探索 Hadoop：大数据处理的利器》
2024-12-22 19:29

赖昌钰的博客 Hadoop 是一个由 Apache ...Hadoop 的核心设计理念是将大数据分解为多个小块，这些小块可以分布在廉价的计算机集群上进行处理。它具有高容错性的特点，即使集群中的某些节点出现故障，系统也能够继续运行而不丢失数据。
Hadoop企业级应用案例：揭秘知名公司的大数据架构
2025-09-28 02:34

AI量化价值投资入门到精通的博客本文以Hadoop生态为核心，结合阿里巴巴、腾讯、Netflix等知名企业的实际应用案例，深入解析Hadoop在企业级大数据场景中的架构设计、性能优化、安全管理与业务价值。内容覆盖Hadoop的理论基础（分而治之思想、主从...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 6月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月14日