发一下spark 2.4 read方法的源码，带注释

好的，以下是Spark 2.4版本中`read`方法的源码注释： ``` /** * Interface used to load a DataFrame from external storage systems (e.g. file systems, * key-value stores, etc). Use `SparkSession.read` to access this. * * @since 1.4.0 */ class DataFrameReader private[spark](@transient val sparkSession: SparkSession) extends ResolvableFunctions { // 省略部分代码 /** * Loads input in as a `DataFrame`, for data sources that support multiple paths. * Only works if the source is a HadoopFsRelationProvider. * * @since 2.4.0 */ @scala.annotation.varargs def load(paths: String*): DataFrame = { val df = format("text").load(paths: _*) // 如果没有指定格式，默认使用"text"格式 df.schema.fields.headOption match { case Some(f) if f.dataType == StringType => df.selectExpr("value as text") case _ => df } } // 省略部分代码 /** * Loads input in as a `DataFrame`, for data sources that support a single path as input. * 指定输入路径，加载为DataFrame，如果没有指定格式，默认使用"text"格式 * @since 1.4.0 */ def load(path: String): DataFrame = { val df = format("text").load(path) df.schema.fields.headOption match { case Some(f) if f.dataType == StringType => df.selectExpr("value as text") case _ => df } } // 省略部分代码 /** * Specifies the input data source format. * 指定输入数据源的格式，支持的格式包括：text、csv、json、jdbc、parquet等 * * @since 1.4.0 */ def format(source: String): DataFrameReader = { this.source = source this } // 省略部分代码 /** * Loads input in as a `DataFrame`, for data sources that require a path to be specified. * Most common use case will probably be to read in data from a directory, e.g.: * {{{ * spark.read.format("parquet").load("/path/to/directory") * }}} * * @since 1.4.0 */ @scala.annotation.varargs def load(paths: Seq[String]): DataFrame = { val df = format("text").load(paths: _*) df.schema.fields.headOption match { case Some(f) if f.dataType == StringType => df.selectExpr("value as text") case _ => df } } // 省略部分代码 } ``` 注意：以上代码并不是完整的类定义，只是其中与`read`方法相关的部分。

发一下spark 2.4 read方法的源码，带注释

相关推荐

Apache-Spark2.20源码中文注释

Apache Spark 2.4 and beyond

基于Scala的Apache Spark源代码注释与翻译设计源码

发一下spark 2.4读取Parquet到df的源码，带注释

发一下spark 读取Parquet合并schema的源码，带注释

spark2.4 udtf udaf

升级spark2.4

spark2.4+hive使用现有hive仓库中的数据

spark 的show（）方法源码分析

apache spark 2.4 中解决复杂数据类型的内置函数和高阶函数介绍

spark-sql执行源码解读

spark read

spark sql insertinto 源码

spark shuffleread

基于spark图书推荐系统源码下载

[译]介绍spark2.4的用于处理复杂数据类型的新内置函数与高阶函数

spark core源码

idea spark源码

spark1.6源码安装包

最新推荐

Hive on Spark源码分析DOC

详解Java编写并运行spark应用程序的方法

Linux下搭建Spark 的 Python 编程环境的方法

Spark-shell批量命令执行脚本的方法

实验七：Spark初级编程实践

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

用 Python 画一个可以动的爱心

JSBSim Reference Manual