环境说明：服务端登录地址详见各任务服务端说明。补充说明：各主机可通过Asbru工具或SSH客户端进行SSH访问；主节点MySQL数据库用户名/密码：root/123456（已配置远程连接）； Spark任务在Yarn上用Client运行，方便观察日志。子任务一：数据抽取编写Scala代码，使用Spark将MySQL库中表ChangeRecord，BaseMachine，MachineData， ProduceRecord全量抽取到Hudi的hudi_gy_ods库（路径为/user/hive/warehouse/hudi_gy_ods.db）中对应表changerecord，basemachine， machinedata，producerecord中。 1、抽取MySQL的shtd_industry库中ChangeRecord表的全量数据进入Hudi的hudi_gy_ods库中表changerecord，字段排序、类型不变，分区字段为etldate，类型为String，且值为当前比赛日的前一天日期（分区字段格式为yyyyMMdd）。PRECOMBINE_FIELD使用ChangeEndTime，ChangeID和ChangeMachineID作为联合主键。使用spark-sql的cli执行select count（*） from hudi_gy_ods.changerecord命令，将spark-sql的cli执行结果分别截图粘贴至客户端桌面【Release\任务B提交结果.docx】中对应的任务序号下；

时间: 2023-11-28 11:50:37 浏览: 149

基于C++和POLL的服务端和客户端源码(含项目说明+详细注释).zip

5星 · 资源好评率100%

【资源说明】基于C++和POLL的服务端和客户端源码(含项目说明+详细注释).zip LINUX网络编程部分开源项目学习和改进 ## 一、基于C++和POLL的服务端和客户端 &emsp;&emsp;1）文献来源：《Linux高性能服务器编程》——游双著；\ &emsp;&emsp;2）参考学习：https://blog.csdn.net/liuxuejiang158blog/article/details/12503269 \ &emsp;&emsp;3）使用说明：终端输入./server ip port即可运行服务端；终端输入./client ip port即可运行客户端；\ &emsp;&emsp;4）项目说明：服务端采用POLL形式监控监听和各客户端的连接，分配较大的用户数据数组实现随机访问提高时间利用率；客户端采用管道通信实现与终端的连接建立，也通过POLL实现端口监管。 ## 二、信号集处理——基于C++ EPOLL和信号集的事件处理 &emsp;&emsp;1）运用socketpair建立全双工管道，通过EPOLL下的ET模式实现信号的快速接入和管道发送，主循环通过EPOLL实现管道的接受和监听以及发送消息；\ &emsp;&emsp;2）文献来源：《Linux高性能服务器编程》——游双著；通过C++进行了程序改写。 ## 三、基于多进程的共享内存 &emsp;&emsp;1）运用多进程实现每个子进程专门管理当前的socket链接，主线程负责监听以及管道；\ &emsp;&emsp;2）文献来源：《Linux高性能服务器编程》——游双著。【备注】 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

抽取MySQL的shtd_industry库中ChangeRecord表的全量数据进入Hudi的hudi_gy_ods库中表changerecord的Scala代码如下： ```scala import org.apache.spark.sql.SparkSession import org.apache.hudi.DataSourceWriteOptions._ import org.apache.hudi.config.HoodieWriteConfig import org.apache.hudi.hive.MultiPartKeysValueExtractor import org.apache.hudi.keygen.SimpleKeyGenerator object ChangeRecordDataExtract { def main(args: Array[String]): Unit = { val spark = SparkSession.builder() .appName("ChangeRecordDataExtract") .enableHiveSupport() .getOrCreate() val etlDate = args(0) val hoodieOptions = Map( TABLE_TYPE_OPT_VAL -> MOR_TABLE_TYPE_OPT_VAL, TABLE_NAME -> "changerecord", RECORDKEY_FIELD_OPT_KEY -> "ChangeID", PRECOMBINE_FIELD_OPT_KEY -> "ChangeEndTime,ChangeID,ChangeMachineID", PARTITIONPATH_FIELD_OPT_KEY -> "etldate", OPERATION_OPT_KEY -> UPSERT_OPERATION_OPT_VAL, KEYGENERATOR_CLASS_OPT_KEY -> classOf[SimpleKeyGenerator].getName, PATH_OPT_KEY -> s"/user/hive/warehouse/hudi_gy_ods.db/changerecord", HUDI_CLEANER_POLICY_OPT_KEY -> "KEEP_LATEST_COMMITS", META_SYNC_ENABLED_OPT_KEY -> "false", HIVE_STYLE_PARTITIONING_OPT_KEY -> "true", HIVE_PARTITION_EXTRACTOR_CLASS_OPT_KEY -> classOf[MultiPartKeysValueExtractor].getName, HIVE_PARTITION_FIELDS_OPT_KEY -> "etldate", HIVE_DATABASE_OPT_KEY -> "hudi_gy_ods", HIVE_TABLE_OPT_KEY -> "changerecord" ) val jdbcUrl = "jdbc:mysql://localhost:3306/shtd_industry" val jdbcProperties = new java.util.Properties() jdbcProperties.setProperty("user", "root") jdbcProperties.setProperty("password", "123456") val changeRecordDF = spark.read.jdbc(jdbcUrl, "ChangeRecord", jdbcProperties) .withColumn("etldate", lit(etlDate)) changeRecordDF.write .format("org.apache.hudi") .options(hoodieOptions) .mode("append") .save() spark.sql("select count(*) from hudi_gy_ods.changerecord").show() spark.stop() } } ``` 其中，etlDate为当前比赛日的前一天日期，使用lit函数将该值添加为一个新的列etldate。hoodieOptions为Hudi的写入配置，对应Hudi表changerecord。jdbcUrl和jdbcProperties为连接MySQL的配置，使用spark.read.jdbc读取MySQL表ChangeRecord的数据。最后使用Hudi的save方法将数据写入Hudi表中，并使用spark.sql查询Hudi表changerecord的数据量。

阅读全文

相关推荐

TCP服务端和TCP客户端工具软件

欧姆龙plc通信源码+OMRON_FINS协议说明(含服务端以及客户端)

如何在Android 4.0.3环境下，通过Sensor Framework实现客户端与服务端的数据交互？请详细说明调用时序图和代码实现。

(1)源码:服务端+pc客户端 (基于vs 2010)

服务端和客户端的说明与操作

请详细说明如何使用CXF配置服务端和客户端，并结合拦截器实现请求的预处理和响应处理？

举例说明在java card中，应用作为服务端如何向客户端提供共享接口

如何在PC客户端与Android服务端之间通过Socket通信实现数据交互，并且详细说明USB连接与ADB端口转发的过程？

举例说明在java card中，应用作为服务端向客户端提供共享接口的情况

UDT::connect 用法客户端 服务端

qt 客户端通过服务端访问后台数据库

如何通过Ultra Corba Simulator进行CORBA服务端的模拟以及客户端与服务端的交互测试？

syslog 实现客户端向服务端传输日志的说明如何配置以及测试

syslog 实现客户端向服务端传输日志的说明如何安装配置以及测试

如何实现PC客户端与Android服务端之间的Socket通信，并详细说明端口转发和ADB命令启动服务的步骤？

CentOS syslog 实现客户端向服务端传输日志的说明如何安装配置以及测试详细说说

Windows Socket API 实现一个以下功能：客户端实现连接服务端，发送一串字符串后服务端会回一个字符串客户端再进行接收。

用多线程方式实现tcp套接字编程：服务端能接收多个客户端的通信。

客户端怎么通过socket与服务端进行连接

最新推荐

python网络编程socket实现服务端、客户端操作详解

Java基于socket实现的客户端和服务端通信功能完整实例

Openssl实现双向认证教程（附服务端客户端代码）

DCOM配置说明-解决客户端无法正常连接服务端问题.doc

物联网学习篇1：Python SDK接入阿里云物联网平台，接收服务端订阅消息

Chrome ESLint扩展：实时运行ESLint于网页脚本

管理建模和仿真的文件

精确率与召回率的黄金法则：如何在算法设计中找到最佳平衡点

在嵌入式系统中，如何确保EFS高效地管理Flash和ROM存储器，并向应用程序提供稳定可靠的接口？

基于 Webhook 的 redux 预处理器实现教程

UDT::connect 用法客户端服务端