首页spark中已知表a，如何通过表a创建一张新表b并指定分区

spark中已知表a，如何通过表a创建一张新表b并指定分区

时间: 2023-06-01 20:05:16 浏览: 88

这是一个技术问题，我可以回答。您可以使用Spark SQL中的CREATE TABLE语句来创建一张新表，并且通过PARTITIONED BY子句来指定分区，具体语句如下： CREATE TABLE b USING Parquet PARTITIONED BY (<partition columns>) AS SELECT * FROM a; 其中，<partition columns>是指需要进行分区的列名，可以有多个列名，以逗号分隔。您也可以根据需要将Parquet换成其他的数据格式，如ORC等。

阅读全文