使用Hadoop的MapReduce,用Java语言编写程序,过滤掉所有只打低于1分且评论次数大于5次的恶意用户的评分

好的，这个问题可以通过编写一个Hadoop MapReduce程序来解决。具体步骤如下： 1. 输入数据格式为每行一个评分记录，包括用户ID、电影ID、评分和评论次数。 2. Mapper阶段：将每行评分记录按照用户ID进行分组，然后对于每个用户的所有评分记录，将评分和评论次数累加起来。 3. Reducer阶段：对于每个用户，判断其评分是否低于1分且评论次数大于5次，如果是则将其过滤掉，否则输出其所有评分记录。下面是MapReduce程序的Java代码示例： ```java public class FilterMaliciousUsers { public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> { private Text userId = new Text(); private IntWritable ratingCount = new IntWritable(); private IntWritable ratingSum = new IntWritable(); public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { String[] fields = value.toString().split(","); userId.set(fields[0]); int rating = Integer.parseInt(fields[2]); int count = Integer.parseInt(fields[3]); ratingSum.set(rating); ratingCount.set(count); context.write(userId, ratingSum, ratingCount); } } public static class Reduce extends Reducer<Text, IntWritable, Text, Text> { public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException { int sum = 0; int count = 0; for (IntWritable value : values) { sum += value.get(); count += 1; } if (sum / count >= 1 || count <= 5) { return; } StringBuilder output = new StringBuilder(); for (IntWritable value : values) { output.append(value.get()).append(","); } context.write(key, new Text(output.toString())); } } public static void main(String[] args) throws Exception { Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "FilterMaliciousUsers"); job.setJarByClass(FilterMaliciousUsers.class); job.setMapperClass(Map.class); job.setReducerClass(Reduce.class); job.setOutputKeyClass(Text.class); job.setOutputValueClass(IntWritable.class); FileInputFormat.addInputPath(job, new Path(args[0])); FileOutputFormat.setOutputPath(job, new Path(args[1])); System.exit(job.waitForCompletion(true) ? 0 : 1); } } ``` 在这个程序中，我们通过Mapper将每行评分记录按照用户ID进行分组，并将评分和评论次数累加起来。在Reducer中，对于每个用户，我们判断其评分是否低于1分且评论次数大于5次，如果是则将其过滤掉，否则输出其所有评分记录。最后，我们将输出结果写入到HDFS中。

使用Hadoop的MapReduce,用Java语言编写程序,过滤掉所有只打低于1分且评论次数大于5次的恶意用户的评分

相关推荐

使用hadoop-streaming运行Python编写的MapReduce程序.rar

基于Hadoop的Java实现用户协同过滤算法源码

wordcount：使用Java的Hadoop MapReduce单词计数

请使用Hadoop的MapReduce,用Java语言编写程序,过滤掉所有只打低于1分且评论次数大于5次的恶意用户的评分

hadoop编写mapreduce程序

使用Java用Hadoop MapReduce按年份分区

在Hadoop集群环境下，利用MapReduce， 使用Java语言，完成数据的求和

用java编写mapreduce程序

编写一个 MapReduce 程序来对 Hadoop.txt 中各个单词出现的次数进行统计

hadoop编写java程序

使用课堂讲解的Hadoop mapreduce，编写map类和reduce类。 （3）对天气数据，计算每个城市id的气温次数（计数）

Java编写基于Hadoop的mapreduce的汽车销售数据统计

通过MapReduce分析家庭成员关系，可以在那些方面提高对Hadoop，MapReduce程序编写

Hadoop MapReduce

hadoop mapreduce

搭建Hadoop单机版，使用MapReduce解决姓名分析问题的代码编写环境

编写简单的mapreduce的java程序

hadoop中mapreduce怎么使用

编写 MapReduce 程序

最新推荐

在Hadoop的MapReduce任务中使用C程序的三种方法

使用Eclipse编译运行MapReduce程序.doc

hadoop mapreduce编程实战

Hadoop源代码分析（包org.apache.hadoop.mapreduce）

使用hadoop实现WordCount实验报告.docx

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

在Hadoop集群环境下，利用MapReduce，使用Java语言，完成数据的求和

使用课堂讲解的Hadoop mapreduce，编写map类和reduce类。（3）对天气数据，计算每个城市id的气温次数（计数）

2．通过python绘制y=e-xsin(2πx)图像