SparkSession
时间: 2023-12-12 14:04:14 浏览: 73
spark-practice
SparkSession是Apache Spark2.0版本中引入的新的编程入口点,它是SparkContext的升级版,可以以编程方式使用Spark。SparkSession提供了一种灵活的方式来处理大型数据集,支持多种文件格式(如Parquet、JSON、CSV)和分布式存储系统(如HDFS、S3)。SparkSession提供了一个统一的API,可以轻松地在不同的数据源之间切换,还可以轻松地处理结构化数据。SparkSession是一个可序列化的对象,可以跨多个JVM节点使用。在Spark应用程序中,SparkSession是一个共享的单例对象,可以通过SparkSession.builder().getOrCreate()方法获取。
阅读全文