某高校为大数据相关专业的学生开设了多门课程，为了能够实时地查找出目标课程，需要在IntelliJ IDEA中使用Spark Streaming编程实现从一台服务器的8888端口上接收课程数据，课程数据需手动在服务器的8888端口输入，输入的课程数据如表所示，每一条数据有2个字段，分别表示课程编号和课程名称，以空格分隔。现目标课程是“Hadoop”和“Spark”，需要查询两门课程及对应课程编号。 121 Hadoop

时间: 2023-12-10 15:04:47 浏览: 24

这个问题可以通过以下代码实现： ```java import org.apache.spark.SparkConf; import org.apache.spark.streaming.Durations; import org.apache.spark.streaming.api.java.JavaDStream; import org.apache.spark.streaming.api.java.JavaPairDStream; import org.apache.spark.streaming.api.java.JavaReceiverInputDStream; import org.apache.spark.streaming.api.java.JavaStreamingContext; import scala.Tuple2; import java.util.Arrays; import java.util.List; public class CourseSearch { public static void main(String[] args) throws InterruptedException { // 创建SparkStreaming上下文 SparkConf conf = new SparkConf().setAppName("CourseSearch").setMaster("local[*]"); JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(1)); // 从服务器的8888端口上接收数据 JavaReceiverInputDStream<String> lines = jssc.socketTextStream("localhost", 8888); // 将每行数据切分成课程编号和课程名称 JavaDStream<List<String>> courses = lines.map(line -> Arrays.asList(line.split(" "))); // 过滤出目标课程 JavaDStream<List<String>> targetCourses = courses.filter(course -> { String courseName = course.get(1); return courseName.equals("Hadoop") || courseName.equals("Spark"); }); // 将目标课程转换为(key, value)对 JavaPairDStream<String, String> coursePairs = targetCourses.mapToPair(course -> new Tuple2<>(course.get(1), course.get(0))); // 输出结果 coursePairs.print(); // 启动SparkStreaming应用 jssc.start(); jssc.awaitTermination(); } } ``` 在输入数据方面，可以在命令行中使用`nc`命令模拟输入数据。首先打开一个终端窗口，输入以下命令： ```bash nc -lk 8888 ``` 然后在新的终端窗口中输入课程数据，例如： ```bash 121 Hadoop 122 Spark 123 Hive 124 HBase ``` 程序会输出以下结果： ``` ------------------------------------------- Time: 1622769220000 ms ------------------------------------------- (Hadoop,121) (Spark,122) ```

相关推荐

将某班学生的《Python程序设计》这门课程的成绩保存在字典中，学号为键(key)，分数为值（value）

Java技术面试课程，通过参与这门课程，学习者将能够系统地学习和巩固Java技术知识，并在面试中展现自己的技术能力和优势

C语言、VB还是Python？-谈高校非计算机专业学生编程入门课程选择.pdf

在学生课程数据库中完成： 编写一个存储过程，，为某个专业的每名学生添加某门课程的-1分成绩。（使用参数确定专业编号和课程编号）

用c++为学生输入若干门课程的成绩信息，并能够统计出每位学生的总成绩。并将所有信息需存放在文本文件中。

用字典保存某名同学的多门课程的成绩，用查找算法分别找出该名同学的最高成绩对应课程和最低成绩对应课程。

mysql语句查询学生表中总共开设课程门数

使用数组求某班50名学生的5门课程的平均成绩

.在SC表中求某班学生某门课程的最高分和最低分的学生信息，输出信息包括学号、姓名、课程名称。

列出某门课程每个学生的总评成绩，及所有学生总评成绩的总评分JAVA

mysql中查询没有选修某两门课的_某学校教师、学生、课程及成绩MySQL分析

用sql写出找出每个学生在每门课程上的最高成绩

C语言出某门课程的最高分和分数最高的学生的姓名函数的设计思路

定义一个类 Student，使用非静态成员函数、静态成员函数和静态数据成员计算学生某门课程的总成绩，并在主函数中进行测试

用sql写出找出每门课程中分数最高的学生及其对应的分数。

使用ANY子查询查找学号为0001的学生的分数比0002号的学生的最低分数高的课程编号和分数

sql查询选修课程2门以上且成绩都在80分以上的学生姓名，专业，总学分

使用动态内存分配创建封装的动态学生类Student的对象数组class，在主函数中计算出所有学生三门课程的平均成绩并输出

最新推荐

【java课设】学生选课系统.pdf

小学生测验C语言课程设计报告

只有两个字段用一个sql语句查询出某个学生的姓名、成绩以及在表中的排名

node-v10.9.0-x86.msi

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

：YOLOv1目标检测算法：实时目标检测的先驱，开启计算机视觉新篇章

info-center source defatult

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

"互动学习：行动中的多样性与论文攻读经历"

在学生课程数据库中完成：编写一个存储过程，，为某个专业的每名学生添加某门课程的-1分成绩。（使用参数确定专业编号和课程编号）