H2O与Spark互操作性存储库已迁移到新地址

需积分: 13 84 浏览量更新于2024-12-28 收藏 857KB ZIP 举报

资源摘要信息:"h2o-sparkling:已弃用！使用 https" 知识点: 1. 版本弃用与迁移指导：文档开头明确指出旧的项目或库（h2o-sparkling）已不再维护，并指示用户迁移到新的库或服务。这是一种常见的维护实践，随着技术的发展和需求的变化，旧的技术或解决方案会被新的替代品取代。对于用户而言，及时关注相关通知，并根据指引进行迁移是必要的，以保证系统的稳定性和安全性。 2. H2O与Spark的互操作性：文档中提到该存储库用于促进H2O和Spark之间的互操作性。H2O是一个开源的高性能机器学习平台，而Apache Spark是一个快速的通用计算引擎。两者在大数据分析领域都十分流行。它们的互操作性意味着可以将H2O的强大机器学习算法与Spark的分布式数据处理能力相结合，这在数据科学和机器学习任务中非常有价值。 3. 技术要求与环境准备： - Spark版本要求：必须使用Spark 1.0.0或更高版本，并且要求带有SQL组件，这是因为项目可能依赖于Spark的SQL模块来处理数据集和执行分布式查询。 - 快子（Flink）版本要求：需要使用0.4.1版本，虽然文档未详细说明快子在此项目中的具体作用，但它可能用于特定的数据处理任务。 - Java版本要求：需要Java 1.6或更高版本，Java是执行和部署Spark应用的必要环境。 4. 安装步骤： - 克隆Spark仓库并编译：文档中提供了详细的安装步骤，包括如何使用git命令克隆Spark仓库，进入仓库目录，以及如何使用sbt工具编译并发布到本地。 - Tachyon支持：如果需要Tachyon的支持，用户需要从Tachyon的官方资源下载并编译相应的版本（0.4.1）。Tachyon是一个分布式内存存储系统，通常用于大规模数据处理。 5. 演示程序编译与运行： - 克隆演示程序仓库，并使用sbt工具编译。特别指出编译阶段的重要性，因为演示程序需要打包成jar文件以在Spark驱动程序中运行。 - 运行演示程序的本地版本时，无需Spark云服务支持。只需执行包含在演示程序中的H2O嵌入Spark驱动程序实例。 6. 标签说明：本资源的标签为“Scala”，这表明文档中的代码示例和项目结构很可能使用Scala语言构建。Scala是一种多范式编程语言，它是基于JVM的，提供了强大的类型系统和函数式编程特性，常用于构建高性能的应用程序。 7. 版本控制和代码提交：资源名称中的“h2o-sparkling-master”表明这是一个代码仓库的主分支名称。在软件开发实践中，使用版本控制系统（如Git）来管理项目的版本历史是一个重要的环节。主分支通常包含最新的、准备发布的代码，而其他分支可能用于开发新功能、修复bug等。总结以上信息，可以看出该文档是关于一个已经不再维护的项目（h2o-sparkling），它曾经用于在H2O和Spark之间实现互操作性。文档提供了迁移指导、技术要求、安装说明、演示程序的编译与运行指南，以及项目仓库的组织结构。对于维护者和用户来说，掌握这些知识点对于使用和维护基于Spark和H2O的项目至关重要。

资源目录

收起资源包目录

H2O与Spark互操作性存储库已迁移到新地址（29个子文件）

idea.sbt 169B

Demo.scala 3KB

AirlinesDemo.scala 1KB

README.md 3KB

x.csv 1KB

DummyFrameExtractor.scala 3KB

core-site.xml 131B

package.scala 703B

Utils.scala 918B

prostate.csv 9KB

package.scala 189B

Utils.scala 1KB

allyears2k_headers.csv 4.37MB

FileBasedFrameExtractor.scala 764B

DistributedFrameExtractor.scala 2KB

AirlinesDemoDRF.scala 1KB

RDD2H2OFrameSerializer.scala 667B

LICENSE.txt 11KB

KryoSerialRegistrator.scala 591B

assembly.sbt 107B

.gitignore 55B

build.sbt 2KB

dtree.sbt 98B

assembly.sbt 58B

Schemas.scala 2KB

ProstateDemo.scala 1KB

TachyonFrameExtractor.scala 2KB

build.properties 19B

SparklingDemo.scala 3KB

共 29 条

Dilwanga

粉丝: 31
资源: 4681

H2O与Spark互操作性存储库已迁移到新地址

kafka-streams-machine-learning-examples：此项目包含一些示例，这些示例演示了如何利用Apache Kafka及其Streams API将分析模型部署到关键任务，可扩展的生产环境中。 使用Python，H2O，TensorFlow，Keras，DeepLearning4和其他技术构建模型

苏打水：苏打水在Spark群集内提供H2O功能

intera-frontend:Inter项目Intera！

PredictionIO-Churn-Prediction-H2O-Sparkling-Water:PredictionIO Engine与苏打水集成。 开源项目2015年Spring@CMU

homebrew-sparkling::high_voltage:brew闪闪发光的安装通过Lightning安装iOS应用

create-sparkling-app:一个仓库中的多个模板，支持npx

pptr-testing-library:木偶+ dom-testing-library =:sparkling_heart:

tiny-care-terminal：:sparkling_heart::laptop_computer:一个小的仪表板，在您使用终端时会尽力照顾您

ReduxMovieDB：:movie_camera:看即将上映的电影！ ReSwift + RxSwift:sparkling_heart:Hacktoberfest:jack-o-lantern:

awesome-docsify：:sparkling_heart:与docsify相关的精选事物精选清单

最新资源

kafka-streams-machine-learning-examples：此项目包含一些示例，这些示例演示了如何利用Apache Kafka及其Streams API将分析模型部署到关键任务，可扩展的生产环境中。使用Python，H2O，TensorFlow，Keras，DeepLearning4和其他技术构建模型

PredictionIO-Churn-Prediction-H2O-Sparkling-Water:PredictionIO Engine与苏打水集成。开源项目2015年Spring@CMU