Spark SQL代码
时间: 2023-10-07 18:11:29 浏览: 95
以下是一些 Spark SQL 的样例代码:
1. 创建 DataFrame
```scala
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder()
.appName("Create DataFrame")
.master("local[*]")
.getOrCreate()
val data = Seq(("Alice", 25), ("Bob", 30), ("Charlie", 40))
val df = spark.createDataFrame(data).toDF("name", "age")
df.show()
```
2. 从数据源加载数据
```scala
val df = spark.read.format("csv")
.option("header", "true")
.option("inferSchema", "true")
.load("path/to/file.csv")
df.show()
```
3. 基本的查询操作
```scala
df.select("name", "age").show()
df.filter($"age" > 30).show()
df.groupBy("age").count().show()
```
4. 使用 SQL 查询语句
```scala
df.createOrReplaceTempView("people")
val result = spark.sql("SELECT name, age FROM people WHERE age > 30")
result.show()
```
5. 操作 DataFrame 中的数据
```scala
import org.apache.spark.sql.functions._
df.withColumn("age_plus_10", col("age") + 10).show()
df.groupBy("age").agg(avg("age"), max("age")).show()
```
以上只是一些 Spark SQL 的基础操作,更多的操作可以参考 Spark SQL 的官方文档。
阅读全文