hive按日期分区保留三年内月末数据sql怎么写

时间: 2024-09-17 11:08:59 浏览: 79

数据分析+hive基础及进阶SQL练习题+面试

5星 · 资源好评率100%

在Hive中，如果你想要保留三年内的每月末数据，并按照日期进行分区，你可以使用`PARTITIONED BY`和` retention`特性结合`ADD PARTITION`命令来实现。假设你的表名为`sales_data`，日期字段为`date`，并且已经有一个月份分区`month`，那么可以尝试以下SQL： ```sql -- 创建一个新的分区目录，例如`monthly_archive`，用于保存每个月末的数据 CREATE TABLE sales_data_monthly_archive ( ... -- 表结构 ) PARTITIONED BY (month STRING, year INT) CLUSTERED BY (date) INTO 1 DAYSPECIFIC PARTITIONS LOCATION 'path/to/monthly_archive'; -- 获取当前年份 SET @current_year = YEAR(CURRENT_DATE()); -- 获取三年前的年份 SET @three_years_ago = DATE_SUB(@current_year, INTERVAL 3 YEAR); -- 删除超过三年的旧数据 MSCK REPAIR TABLE sales_data; -- 逐月备份并添加新的分区，只保留最近三年的每月末数据 FOR d IN ('01', '02', ..., '12') LOOP SET @year = IF(@current_year <= @three_years_ago, @three_years_ago, @current_year); SET @month = CONCAT('0', d); -- 如果需要两位数的月份 -- 示例：将本月末数据移动到新分区 INSERT INTO TABLE sales_data_monthly_archive PARTITION (month = '@month', year = @year) SELECT * FROM sales_data WHERE month = CONCAT('0', d) AND date = CONCAT(year, '-', month, '-30'); END LOOP; -- 清理原始表，只保留最新分区的数据 ALTER TABLE sales_data ADD PARTITION (month='12', year=@current_year) location 'path/to/original'; ANALYZE TABLE sales_data COMPUTE STATISTICS; TRUNCATE TABLE sales_data PARTITION(month, year); -- 将新分区设置为默认分区 ALTER TABLE sales_data_monthly_archive SET DEFAULT partitions (month='12', year=@current_year); ```

阅读全文

hive按日期分区保留三年内月末数据sql怎么写

相关推荐

hive sql + left join 数据缺失

大数据hive数据倾斜，hive-sql优化

bdp2hive:生成hive分区表、sqoop导入数据至hive

Hive.sql，hive的元数据

Hive表分区

hive数据分区时分区字段不可为中文。.doc

hive 双分区外部表 复合数据结构 样例

hive分区导入

sql练习一hive数据库数据

hive元数据导入sql生成工具

Hive的分区表

hivesql笔记.sql

基于Java与Python的多语言支持，实现datax hive动态分区和kafka读写功能的数据集成设计源码

hiveSQL50

hive sql解析

Hive sql优化

Hive面试题SQL测试题目1数据

Hive面试题SQL测试题目2数据

最新推荐

SQL按照日、周、月、年统计数据的方法分享

详解hbase与hive数据同步

基于Hadoop的数据仓库Hive学习指南.doc

HIVE-SQL开发规范.docx

shell中循环调用hive sql 脚本的方法

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

hive 双分区外部表复合数据结构样例