InfluxDB入门：数据格式与核心概念解析

154 浏览量更新于2024-08-27 收藏 161KB PDF 举报

"InfluxDB是一个专为时间序列数据设计的开源数据库，本文将深入探讨其核心概念和基本操作，包括数据格式、与传统数据库的对比以及Point和Series的概念。" InfluxDB是一个高性能的时序数据库，尤其适用于监控、IoT及实时分析等场景。在了解InfluxDB的基本操作之前，我们首先需要理解其关键概念。 1. 数据格式 InfluxDB的数据结构非常独特，一条数据可以被视为一个由多个部分组成的虚拟key和对应的value。这个虚拟key包含数据库名(database)，存储策略(retention policy)，测量指标名(measurement)，标签集(tagsets)，字段名(fieldname)和时间戳(timestamp)。数据库名决定了数据存储的位置，存储策略定义了数据的保留时间，测量指标名用于标识特定的度量，标签集提供了一种对数据进行分类的方式，字段名则存储具体的数值，而时间戳是每条数据不可或缺的部分，用于定位数据的时间点。 2. 存储策略存储策略允许用户定义数据的生命周期。默认策略“autogen”通常设置为永久保存，但用户可以自定义策略，如保留最近两小时的数据。未指定策略时，默认策略会被使用，且默认策略可被修改。InfluxDB会自动清理过期数据，以保持数据库的效率和容量。 3. 标签和索引 InfluxDB中的标签(tag)至关重要，因为它与测量指标名一起构成了数据库的索引。标签以“key-value”形式存在，不同tagset表示不同的键值对组合。这使得数据查询高效，因为索引是基于标签的。 4. Point和Series Point是InfluxDB中的基本数据单元，类似于传统数据库中的一行记录。它由时间戳、字段和标签组成，提供了一种结构化的数据存储方式。时间戳用于记录数据产生的时刻，字段存储实际的数值数据，而标签则提供了额外的分类信息。 5. Series Series是具有相同database、retention policy、measurement和tagsets的数据集合。在InfluxDB中，尽管多个Point可能有相同的基本属性，但只要有一个字段或时间戳不同，它们就会被看作是不同的Series。 InfluxDB的基本操作通常涉及创建数据库、定义存储策略、写入数据（通过Point的形式）以及使用标签和时间戳进行复杂查询。理解这些核心概念对于有效地利用InfluxDB处理时间序列数据至关重要。通过熟练掌握这些知识，用户可以更高效地存储、管理和分析来自各种实时系统的监控数据和事件流。

InfluxDB概念和基本操作概念和基本操作

InfluxDB基本概念

1、数据格式

在 InfluxDB 中，我们可以粗略的将要存入的一条数据看作一个虚拟的 key 和其对应的 value(field value)。格式如下：

虚拟的 key 包括以下几个部分： database, retention policy, measurement, tag sets, field name, timestamp。

database: 数据库名，在 InfluxDB 中可以创建多个数据库，不同数据库中的数据文件是隔离存放的，存放在磁盘上的不同目

录。

retention policy: 存储策略，用于设置数据保留的时间，每个数据库刚开始会自动创建一个默认的存储策略 autogen，数据保

留时间为永久，之后用户可以自己设置，例如保留最近2小时的数据。插入和查询数据时如果不指定存储策略，则使用默认存

储策略，且默认存储策略可以修改。InfluxDB 会定期清除过期的数据。

measurement: 测量指标名，例如 cpu_usage 表示 cpu 的使用率。

tag sets: tags 在 InfluxDB 中会按照字典序排序，不管是 tagk 还是 tagv，只要不一致就分别属于两个 key，例如

host=server01,region=us-west 和 host=server02,region=us-west 就是两个不同的 tag set。

tag--标签，在InfluxDB中，tag是一个非常重要的部分，表名+tag一起作为数据库的索引，是“key-value”的形式。

field name: 例如上面数据中的 value 就是 fieldName，InfluxDB 中支持一条数据中插入多个 fieldName，这其实是一个语法上

的优化，在实际的底层存储中，是当作多条数据来存储。

timestamp: 每一条数据都需要指定一个时间戳，在 TSM 存储引擎中会特殊对待，以为了优化后续的查询操作。

2、与传统数据库中的名词做比较

3、Point

Point由时间戳（time）、数据（field）、标签（tags）组成。

Point相当于传统数据库里的一行数据，如下表所示：

4、Series

Series 相当于是 InfluxDB 中一些数据的集合，在同一个 database 中，retention policy、measurement、tag sets 完全相同的

数据同属于一个 series，同一个 series 的数据在物理上会按照时间顺序排列存储在一起。

5、Shard

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38725950

粉丝: 3

InfluxDB入门：数据格式与核心概念解析

C#读写Influxdb代码例子

实用的influxdb连接工具

InfluxDBStudio-0.2.0.zip

InfluxDB相关概念解释

influxdb如何快速上手

如何学习influxdb

influxdb学习视频

influxdb Mac

时序型数据库InfluxDB

influxdb的core.

最新资源