Doris使用最佳实践:字符集与建表规范指南
需积分: 5 103 浏览量
更新于2024-08-03
1
收藏 336KB PDF 举报
Doris使用规范(最佳实践)是一份指导用户高效、正确地使用Doris大数据处理引擎的文档。这份规范强调了在数据库设计和操作中的关键原则,旨在提升性能和避免常见问题。
1. 字符集规范:
- 强制:所有数据库需使用utf-8字符集,这是Doris的唯一支持格式,确保数据的一致性和兼容性。
2. 命令规范:
- 建议:库名应遵循小写,用下划线分隔且长度不超过62字节,便于管理。
- 建议:表名也采用小写,同样用下划线分隔,长度限制在64字节,保持命名一致性。
3. 建表规范:
- 强制:每个tablet的大小应设定在1-3GB范围内,以优化磁盘使用和查询性能。
- 强制:当数据量超过5亿时,必须实施分区分桶策略,根据不同场景:
- 对于维度表,根据数据增长率选择分区和桶的数量,例如:
- 小于1GB:1个桶
- 1-3GB:3-5个桶
- 3-5GB:7-10个桶
- 对于事实表,根据增长速度和存储周期确定桶数,但建议保持单个桶在1-3GB。
- 建议:1000万到2亿之间的数据,为了简洁可以不设置分区,直接使用分桶策略。
- 强制:小于2000万的数据禁止使用动态分区,以防止无谓的资源消耗和用户不易察觉的问题。
- 特殊处理:针对历史数据不均衡或查询概率低的情况,可以创建专门的历史分区,如按年月存放。
4. 数据倾斜与优化:
- 避免数据倾斜:通过对分桶字段进行加盐处理,确保查询策略一致,同时考虑随机分桶以实现均匀分布。
这些最佳实践能够帮助用户提高Doris系统的性能,减少维护成本,并确保数据的准确性和一致性。在实际操作中,遵守这些规范将有助于构建健壮的大数据架构。
2021-09-19 上传
2019-12-10 上传
2021-10-18 上传
2023-03-14 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
StarsL.cn
- 粉丝: 459
- 资源: 7
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建