以下程序是持续监控目录下数据，还是只执行一次：import json import os from kafka import KafkaConsumer def read_config(config_file): """读取配置文件""" with open(config_file, "r") as f: config = json.load(f) return config def create_consumer(): """创建 Kafka 消费者""" consumer = KafkaConsumer( bootstrap_servers=["localhost:9092"], group_id="my-group", ) return consumer def subscribe_topics(consumer, topics): """订阅需要监控的 topic""" for topic in topics: consumer.subscribe([topic]) def write_to_file(topic, message, output_dir): """将消息写入对应的输出路径""" output_path = os.path.join(output_dir, f"{topic}.txt") with open(output_path, "a") as f: f.write(f"{message}\n") if name == "main": # 读取配置文件 config = read_config("config.json") topics = list(config.keys()) # 创建 Kafka 消费者 consumer = create_consumer() # 订阅需要监控的 topic subscribe_topics(consumer, topics) # 监控消息 for message in consumer: topic = message.topic value = message.value.decode("utf-8") monitor_dir = config[topic]["监控路径"] output_dir = config[topic]["消费路径"] if value.startswith(monitor_dir): write_to_file(topic, value, output_dir)

时间: 2024-04-27 17:20:51 浏览: 141

根据程序的结构和逻辑，可以看出该程序是持续监控 Kafka 中指定的 topic，将消息写入对应的输出路径，直到程序被手动停止。具体来说，程序一开始会读取配置文件，获取需要监控的 topic 和对应的监控路径、消费路径等信息，然后创建 Kafka 消费者，订阅需要监控的 topic，之后进入循环，不断监控 Kafka 中的消息，如果消息的 topic 在需要监控的列表中，且消息的内容以监控路径开头，就会将消息写入对应的输出路径。因此，程序是持续监控 Kafka 中的消息，而不是只执行一次。

# -- coding: utf-8 -- from kafka import KafkaConsumer from datetime import datetime import json import redis import configparser # 设置Kafka消费者 #consumer = KafkaConsumer('m2m-alarm', bootstrap_servers=['10.104.170.4:9092'],auto_offset_reset='earliest') consumer = KafkaConsumer('m2m-alarm', bootstrap_servers=['10.104.170.4:9092']) #设置redis信息 redisPool = redis.ConnectionPool(host='211.136.203.185', port=22022,decode_responses=True,encoding='GBK') redis_client = redis.Redis(connection_pool=redisPool) Warnkey='CDNWARN' #设置打印labelValue标识 LabelValueTrue=['bandwidthBillFlowDifPtg','countryBwBillFlowDifPtg','billFlowDifPtg','mfs_status','opStatFlowDifPtg','bandwidthOpStatFlowDifPtg','opStat5mFlowDifPtg','countryOpStat5mFlowDifPtg','countryBwOfflineOpFlowDifPtg','telnet','custBillFlowDifPtg','errorRecordsPtg','ceres_trans_obstime'] def send_message(message): # 创建ConfigParser对象 config = configparser.ConfigParser() # 读取配置文件 config.read('config.ini') # 获取配置项的值 Blackkeywords = config.get('black', 'blackkeywords') Blackkeywordkey1= config.get('blacklist', 'list1') Blackkeywordkey2= config.get('blacklist', 'list2') Blackkeywords_list = Blackkeywords.split(',') Blackkeywords_list1 = Blackkeywordkey1.split(',') Blackkeywords_list2 = Blackkeywordkey2.split(',') ifhit= any(value in message for value in Blackkeywords_list) ifhis1 =any(value in message for value in Blackkeywords_list1) ifhis2 =any(value in message for value in Blackkeywords_list2) # 检查字符串中是否包含子字符串 if ifhit or (ifhis1 and ifhis2): print (message,"命中屏蔽,不发送告警微信") else: print (message,"未命中屏蔽,发送告警微信") redis_client.lpush(Warnkey,warnmessage) # 消费数据 for message in consumer: try: # 解析JSON数据 data = json.loads(message.value.decode('utf-8')) if data['type'] == 1:

<think>好的，我现在要解决的问题是如何使用Python从Kafka消费消息，然后通过Redis发送告警信息，同时根据配置文件中的黑名单关键字来决定是否发送告警。用户还提到需要用到configparser来读取配置文件进行黑白名单过滤。我需要一步步思考怎么实现这个需求。首先，我需要明确整个流程的大致步骤。大概分为以下几个部分： 1. 读取配置文件，获取Kafka和Redis的连接配置，以及黑名单关键字。 2. 连接Kafka消费者，订阅相关主题并消费消息。 3. 对每条消息进行黑名单过滤，检查是否包含关键字。 4. 如果消息需要告警，则将告警信息存储到Redis中，或者通过Redis的发布订阅机制发送通知。 5. 处理可能的异常情况，比如配置文件中缺少必要的字段，或者连接失败等。接下来，我需要考虑每个步骤的具体实现方法。首先是读取配置文件。用户提到了configparser模块，我需要使用它来读取INI格式的配置文件。配置文件可能包含Kafka的地址、主题，Redis的主机、端口、数据库，以及黑名单的关键字列表。例如，配置文件可能的结构如下： [Kafka] bootstrap_servers = localhost:9092 topic = alerts [Redis] host = localhost port = 6379 db = 0 [Filter] blacklist = error,failure,outage 读取这些配置的时候需要注意，黑名单可能是一个逗号分隔的字符串，需要转换成列表。同时，要处理可能的异常，比如没有找到对应的section或option，这时候需要捕获configparser.NoSectionError或NoOptionError，并给出友好的提示或者默认值。例如，用户提供的引用[2]中提到使用绝对路径来读取配置文件，避免路径问题，这需要确保配置文件的位置正确。接下来是连接KafkaConsumer。需要使用kafka-python库中的KafkaConsumer类。需要传入bootstrap_servers和topic，可能还需要设置消费者组group_id。然后循环消费消息，对每条消息进行处理。然后是过滤消息。对于每条消息，需要检查其内容是否包含黑名单中的任何一个关键字。如果包含，则不发送告警；如果不包含，则发送。这里需要注意的是，黑名单过滤的逻辑是：如果消息包含任何黑名单中的关键字，则跳过，否则发送。或者用户的需求可能是相反的，可能黑名单是阻止发送，而白名单是允许发送，需要明确。根据用户的问题描述，是“根据配置文件中的黑名单关键字决定是否发送告警”，也就是当消息中包含黑名单中的关键字时，不发送告警。因此，如果消息内容包含任何一个黑名单中的词，就过滤掉，否则发送。然后是处理告警，将信息发送到Redis。这里有两种可能的方式：一种是将告警信息存储到Redis的某个数据结构中，比如列表或者有序集合，另一种是通过Redis的发布订阅功能，发布到一个频道，让订阅者处理。用户的问题中提到“通过Redis发送告警信息”，可能指的是后者，即使用Redis的pub/sub机制。或者也可能是将告警信息存入Redis，供其他服务读取。需要进一步明确。假设用户希望将告警信息存储到Redis的一个列表中，或者发布到特定频道。接下来，需要连接Redis，使用redis-py库。读取配置中的host、port、db，然后创建StrictRedis实例。在代码结构上，可能的步骤是： 1. 读取配置文件，获取所有必要的参数。 2. 初始化KafkaConsumer和Redis连接。 3. 消费消息，过滤，发送到Redis。另外需要考虑异常处理，比如Kafka连接失败，Redis连接失败，配置项缺失等。例如，当读取配置文件时，如果某个section不存在，configparser会抛出NoSectionError，这时需要捕获并处理，可能记录错误日志并退出程序。现在，具体实现细节：配置文件的结构需要明确。比如，假设配置文件config.ini的结构如下： [Kafka] bootstrap_servers = localhost:9092 topic = alerts group_id = alert_consumer [Redis] host = localhost port = 6379 db = 0 alert_channel = alerts_channel [Filter] blacklist = error,fatal,outage 读取配置时，使用configparser读取各个字段。比如： - Kafka的bootstrap_servers应该是一个逗号分隔的字符串，可能多个broker地址。 - topic是消费的主题。 - group_id是消费者组ID，可选，但最好设置，以便管理偏移量。 - Redis部分需要host、port、db，以及可能存储告警的键名或者频道名。 - Filter的blacklist是逗号分隔的关键字列表。然后，初始化KafkaConsumer： from kafka import KafkaConsumer consumer = KafkaConsumer( config['topic'], bootstrap_servers=config['bootstrap_servers'].split(','), group_id=config.get('group_id', 'default_group') # 如果配置中没有，使用默认 ) 对于Redis： import redis redis_conn = redis.Redis( host=config['host'], port=config.getint('port'), db=config.getint('db') ) 如果配置中有alert_channel，可以使用pubsub： channel = config.get('alert_channel', 'alerts') redis_conn.publish(channel, message) 或者将告警信息存储到某个列表： redis_key = config.get('alert_list_key', 'alerts_list') redis_conn.lpush(redis_key, message) 具体取决于需求。这里可能需要用户明确，但问题描述中没有具体说明，所以可能需要两种方式都考虑，或者根据常规做法选择。过滤部分： blacklist = [kw.strip() for kw in config['blacklist'].split(',') if kw.strip()] 对于每条消息，假设消息是字符串格式，检查是否包含任一黑名单关键字： message_value = message.value.decode('utf-8') # 假设消息是bytes类型，需要解码 if any(keyword in message_value for keyword in blacklist): # 包含黑名单关键字，跳过 continue else: # 发送告警到Redis redis_conn.publish(channel, message_value) 或者，如果消息是JSON格式，可能需要解析后检查特定字段。但用户的问题中没有说明消息的具体格式，所以假设是纯文本。现在，将这些步骤整合成代码。同时处理可能的异常，比如配置读取错误，连接失败等。可能的代码结构： import configparser import os from kafka import KafkaConsumer import redis BASE_DIR = os.path.dirname(os.path.abspath(__file__)) config = configparser.ConfigParser() config.read(os.path.join(BASE_DIR, 'config.ini')) # 读取Kafka配置 try: bootstrap_servers = config.get('Kafka', 'bootstrap_servers') topic = config.get('Kafka', 'topic') group_id = config.get('Kafka', 'group_id', fallback='alert_group') except configparser.NoSectionError as e: print(f"配置错误：{e}") exit(1) except configparser.NoOptionError as e: print(f"配置错误：{e}") exit(1) # 读取Redis配置 try: redis_host = config.get('Redis', 'host') redis_port = config.getint('Redis', 'port') redis_db = config.getint('Redis', 'db') alert_channel = config.get('Redis', 'alert_channel', fallback='alerts') except configparser.NoSectionError as e: print(f"配置错误：{e}") exit(1) except configparser.NoOptionError as e: print(f"配置错误：{e}") exit(1) # 读取黑名单 try: blacklist_str = config.get('Filter', 'blacklist') blacklist = [kw.strip() for kw in blacklist_str.split(',') if kw.strip()] except configparser.NoSectionError: blacklist = [] except configparser.NoOptionError: blacklist = [] # 初始化Kafka消费者 consumer = KafkaConsumer( topic, bootstrap_servers=bootstrap_servers.split(','), group_id=group_id, auto_offset_reset='earliest' # 根据需要设置 ) # 初始化Redis连接 redis_conn = redis.Redis(host=redis_host, port=redis_port, db=redis_db) # 消费消息 for message in consumer: try: msg_value = message.value.decode('utf-8') # 检查黑名单 if any(keyword in msg_value for keyword in blacklist): print(f"消息包含黑名单关键字，已过滤: {msg_value}") continue # 发送到Redis redis_conn.publish(alert_channel, msg_value) print(f"已发送告警: {msg_value}") except Exception as e: print(f"处理消息时发生错误: {e}") 这段代码的大致流程就是读取配置，连接Kafka和Redis，然后消费消息，过滤后发送到Redis的发布频道。需要注意的几个点： 1. 配置文件的路径是否正确，需要确保config.ini位于正确的位置。用户引用[2]中提到使用BASE_DIR来构建绝对路径，避免路径问题。 2. 黑名单的处理，如果配置文件中没有Filter部分或者blacklist选项，则默认黑名单为空列表，即所有消息都发送告警。是否合理？或者应该让用户必须配置？这取决于需求，但根据用户的问题，可能需要黑名单存在，所以如果用户没有配置，可能需要警告或处理。 3. Kafka消费者的参数可能需要更多配置，比如auto_offset_reset，enable_auto_commit等，需要根据实际情况调整。 4. Redis的发布/订阅是否持久化？如果消费者在发送时Redis不可用，是否需要重试？这里可能需要增加重试机制或者异常处理，比如捕获redis.exceptions.ConnectionError并尝试重新连接。 5. 消息解码，假设消息是UTF-8编码，如果不是的话可能会出错，需要处理解码异常。 6. 黑名单的检查是否区分大小写？比如，如果黑名单中有"error"，而消息中有"Error"，是否会被过滤？这需要明确，可能在代码中将消息和关键字都转为小写，或者保持原样。根据用户需求，此处可能保持原样，即区分大小写。另外，用户可能需要白名单和黑名单的组合过滤，但问题中只提到黑名单，所以只需处理黑名单。测试部分也需要考虑，比如发送测试消息到Kafka，查看是否被正确过滤和发送到Redis。现在，根据这些思考，整理回答的结构： 1. 配置文件的设置，包括Kafka、Redis、Filter部分。 2. 使用configparser读取配置，处理路径和异常。 3. 初始化KafkaConsumer和Redis连接。 4. 消费消息并过滤黑名单关键字。 5. 发送符合条件的消息到Redis。 6. 异常处理和日志记录。在代码示例中需要展示这些步骤，同时引用用户提供的configparser的引用，比如处理路径问题使用os.path.join(BASE_DIR, 'config.ini')，如引用[2]中的方法。可能的问题： - 用户提到“同时根据配置文件中的黑名单关键字决定是否发送告警”，所以过滤逻辑是当消息包含黑名单中的任何关键字时，不发送。因此，在代码中，如果消息内容包含任意黑名单关键字，跳过；否则发送。 - 是否需要使用正则表达式进行匹配，而不仅仅是子字符串匹配？比如，是否要匹配整个单词？问题中没有说明，所以保持简单，使用子字符串检查。最后，生成相关问题，例如关于性能优化，配置管理，异常处理等。</think>### 从Kafka消费消息并通过Redis发送告警的实现步骤 #### 1. 配置文件设置创建 `config.ini` 文件，包含以下内容： ```ini [Kafka] bootstrap_servers = localhost:9092 topic = alerts group_id = alert_consumer [Redis] host = localhost port = 6379 db = 0 alert_channel = alerts_channel [Filter] blacklist = error,failure,outage ``` #### 2. 读取配置文件使用 `configparser` 读取配置并处理路径问题[^2]： ```python import configparser import os from kafka import KafkaConsumer import redis BASE_DIR = os.path.dirname(os.path.abspath(__file__)) config = configparser.ConfigParser() config.read(os.path.join(BASE_DIR, 'config.ini')) # 读取Kafka配置 bootstrap_servers = config.get('Kafka', 'bootstrap_servers') topic = config.get('Kafka', 'topic') group_id = config.get('Kafka', 'group_id', fallback='default_group') # 读取Redis配置 redis_host = config.get('Redis', 'host') redis_port = config.getint('Redis', 'port') redis_db = config.getint('Redis', 'db') alert_channel = config.get('Redis', 'alert_channel', fallback='alerts') # 读取黑名单 blacklist = [ kw.strip() for kw in config.get('Filter', 'blacklist', fallback='').split(',') if kw.strip() ] ``` #### 3. 初始化Kafka消费者和Redis连接 ```python # 初始化Kafka消费者 consumer = KafkaConsumer( topic, bootstrap_servers=bootstrap_servers.split(','), group_id=group_id, auto_offset_reset='earliest' ) # 初始化Redis连接 redis_conn = redis.Redis( host=redis_host, port=redis_port, db=redis_db ) ``` #### 4. 消费消息并过滤 ```python for message in consumer: msg_value = message.value.decode('utf-8') # 检查黑名单 if any(keyword in msg_value for keyword in blacklist): print(f"过滤消息（含黑名单关键字）: {msg_value}") continue # 发送到Redis频道 redis_conn.publish(alert_channel, msg_value) print(f"已发送告警: {msg_value}") ``` #### 5. 异常处理 - **配置缺失**：捕获 `NoSectionError` 和 `NoOptionError` - **连接失败**：添加 `try...except` 块处理网络异常 ```python try: bootstrap_servers = config.get('Kafka', 'bootstrap_servers') except configparser.NoSectionError: print("配置文件中缺少Kafka部分") exit(1) ``` --- ###

阅读全文

相关推荐

csv-kafka-json:一个简单的Java程序以JSON格式将CSV文件发送到Kafka主题

kafka config

Flume 抽取MYSQL Oracle数据 JSON格式 推送Kafka

Kafka消息格式：Avro、Protobuf和JSON

Kafka与Hadoop整合指南：实时数据处理进阶技巧

【HDFS数据格式兼容性】：Kafka与Spark集成，流处理与批处理的最佳实践

Python数据仪表盘：实时监控数据指标，掌控数据动态

事件驱动编程实战指南：基于Kafka构建分布式消息处理系统

【Celery与消息代理交互】：深入理解Kafka与Celery集成

【Python日志与监控】：将日志数据转化为系统监控和报警的有效途径

微信小程序登录后端日志分析与监控：Python管理指南

QCA7005数据表与应用无缝集成：API设计与数据交互优化

【数据一致性校验技术】：确保迁移质量的关键步骤

【SYMC控制器监控系统】：实现【实时数据可视化】与故障预测

【EtherNet_IP网络管理】：Kvaser设备监控与维护的专家策略

数据库对象转JSON常见问题全解析：逐一击破，解决难题

大数据HDFS中智能监控与数据统计分析

Hadoop在物联网数据处理中的作用：处理海量设备数据的利器

【性能监控】：实时监控四通OKI5760SP驱动，保持最优打印质量

大家在看

silvaco中文学习资料

AES128（CBC或者ECB）源码

EMC VNX 5300使用安装

华为MA5671光猫使用 华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载

视频转换芯片 TP9950 iic 驱动代码

最新推荐

python3实现从kafka获取数据,并解析为json格式,写入到mysql中

kafka-python批量发送数据的实例

kafka+flume 实时采集oracle数据到hive中.docx

Kafka the Definitive Guide 2nd Edition

Kafka接收Flume数据并存储至HDFS.docx

掌握Android RecyclerView拖拽与滑动删除功能

【IBM HttpServer入门全攻略】：一步到位的安装与基础配置教程

[root@localhost~]#mount-tcifs-0username=administrator,password=hrb.123456//192.168.100.1/ygptData/home/win mount：/home/win：挂载点不存在

惠普8594E与IT8500系列电子负载使用教程

MATLAB与Python在SAR点目标仿真中的对决：哪种工具更胜一筹？

Flume 抽取MYSQL Oracle数据 JSON格式推送Kafka

华为MA5671光猫使用华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载