prometheus基本使用
时间: 2024-02-20 11:52:05 浏览: 134
Prometheus是一个开源的系统监控和警报工具,它支持多种数据采集方式,包括自主的Prometheus采集器、服务端的exporter插件以及第三方的pushgateway等。以下是Prometheus的基本使用方法:
1. 安装和启动Prometheus
Prometheus可以在官网上下载二进制文件,也可以使用容器来部署。安装好后,可以使用命令行启动Prometheus:
```
./prometheus --config.file=prometheus.yml
```
其中,prometheus.yml是一个配置文件,用于指定数据采集器和数据存储方式等。
2. 配置数据采集器
Prometheus支持多种数据采集器,包括自主的Prometheus采集器、服务端的exporter插件以及第三方的pushgateway等。可以在prometheus.yml文件中配置数据采集器:
```
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
- job_name: 'node_exporter'
static_configs:
- targets: ['localhost:9100']
```
以上配置实现了对本地的Prometheus采集器和node_exporter采集器的监控。
3. 查询数据
Prometheus提供了一个查询语言PromQL,用于查询和分析采集到的数据。可以使用Prometheus的WebUI或API查询数据:
```
http://localhost:9090/graph?g0.range_input=1h&g0.expr=node_cpu{mode="idle"}&g0.tab=0
```
以上查询语句查询了最近1小时内所有节点的空闲CPU时间。
4. 设置警报规则
Prometheus支持设置警报规则,当某个监控指标超过或低于特定阈值时,会触发警报。可以在prometheus.yml文件中配置警报规则:
```
rules:
- alert: HighCPUUsage
expr: node_cpu{mode="user"} > 90
for: 5m
labels:
severity: warning
annotations:
summary: "High CPU usage detected"
description: "CPU usage for {{ $labels.instance }} is {{ $value }}%"
```
以上规则表示,当某个节点的用户CPU占用率超过90%持续5分钟时,会触发一个警报,并在警报信息中包含节点名称和CPU占用率。
阅读全文