SparkSession 读取txt文件内容有几种方式
时间: 2023-12-08 08:06:34 浏览: 246
在 Spark 中,使用 SparkSession 读取 txt 文件的方式有以下几种:
1. 通过 textFile() 方法读取:使用 SparkSession 的 textFile() 方法可以读取 txt 文件内容,并将每一行作为一个字符串返回。示例代码如下:
```java
SparkSession spark = SparkSession.builder().appName("ReadTxtFile").master("local[*]").getOrCreate();
JavaRDD<String> rdd = spark.sparkContext().textFile("path/to/file.txt", 1).toJavaRDD();
```
2. 通过 read().text() 方法读取:使用 SparkSession 的 read().text() 方法也可以读取 txt 文件内容,并将每一行作为一个字符串返回。示例代码如下:
```java
SparkSession spark = SparkSession.builder().appName("ReadTxtFile").master("local[*]").getOrCreate();
Dataset<Row> df = spark.read().text("path/to/file.txt");
```
3. 通过 read().textFile() 方法读取:使用 SparkSession 的 read().textFile() 方法也可以读取 txt 文件内容,并将每一行作为一个字符串返回。示例代码如下:
```java
SparkSession spark = SparkSession.builder().appName("ReadTxtFile").master("local[*]").getOrCreate();
Dataset<String> ds = spark.read().textFile("path/to/file.txt");
```
以上三种方式都可以读取 txt 文件内容,具体使用哪种方式取决于你的需求和个人喜好。
阅读全文