Kafka驱动的企业日志收集与Nginx反代实战

需积分: 0 53 浏览量更新于2024-06-21 收藏 548KB DOCX 举报

本项目是一个基于Kafka的Web日志收集与处理系统，模拟了企业服务器中的日志采集、存储、消费和分析流程。涉及的关键技术包括Nginx作为反向代理、Keepalived实现高可用性、Filebeat负责数据收集，Kafka作为消息队列用于传输日志，Zookeeper提供分布式服务管理，以及MySQL用于存储和查询数据，整个架构在CentOS操作系统环境中构建。项目的核心部分首先涉及部署反向代理集群，这里选择了Nginx。Nginx通过两种方式进行安装：一是使用yum包管理器自动安装，确保其正确安装后，可以通过`rpm-qa | grep nginx`命令进行验证。Nginx的配置文件被扩展到`/etc/nginx/conf.d`目录下，创建自定义虚拟主机`xy.conf`，设置了监听端口、域名、访问日志路径，并配置了网站目录和索引文件。接着，项目引入了Python Flask框架，在后端服务器集群上安装Python3和Flask库，编写了一个简单的Flask应用以接收来自前端的请求。Flask应用运行在每个节点上，通过nohup命令后台运行，并通过`ps -ef | grep python`确认进程状态。在这个过程中，Kafka扮演了关键角色，作为日志数据的中间件，负责收集、存储和传递各个节点产生的日志。Filebeat作为数据收集工具，可能负责将Nginx和其他服务的日志发送到Kafka队列中。Zookeeper则确保了Kafka集群的协调和健康检查。 MySQL用于存储日志数据，可以提供历史查询和分析功能，帮助用户理解网站流量和性能。Keepalived可以用来实现Nginx集群的高可用性，确保即使某一台服务器故障，也能通过负载均衡快速切换到其他服务器继续提供服务。这个项目展示了如何通过集成多种IT技术来构建一个全面的日志管理解决方案，旨在提升企业的运维效率和数据处理能力。通过这个项目，学习者不仅可以掌握Kafka、Nginx、Filebeat等技术的实际应用，还能深入了解分布式系统的设计与优化。

proxy_pass http://192.168.1.117:5000/;

}

#后端真实服务器测试修改

安装 gunicorn -- pip3 install gunicron

将 flask-test.py 里的最后一行 app.run()注释掉。

启动服务使用 gunicorn

gunicorn flask-test:app -b "0.0.0.0:5000" --access-logfile='./access_sc.log'

--access-logformat='%({x-forwarded-for}i)s %(l)s %(u)s %(t)s "%(r)s" %(s)s %(b)s

"%(f)s" "%(a)s"' &

添加负载均衡：

在 xy.conf 文件中和 server 作用域同级下添加：

upstream flask_backend{

server 192.168.1.117:5000;

server 192.168.1.117:6000;

}

修改 proxy_pass:

proxy_pass http://flask_backend/;

######负载均衡-健康检查

nginx --自带检查（被动）

当有请求过来的时候，如果请求刚好被代理到 down 掉的后端真实机，会重

新转发一次，转发到可以正常提供服务的真实服务器。

这种检查被动，不能提前发现后端真实服务器的一个状态，而且可能会产生

多一次转发，影响效率。

nginx -- 主动健康检查 -- nginx_upstream_check_module

去/opt 目录下，下载模块

wget

https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/master

安装 unzip patch 命令： yum install unzip patch -y

在/opt 目录下解压：unzip master

#去 nginx 下载路径下，打补丁

patch -p1 < /opt/nginx_upstream_check_module-master/check_1.20.1+.patch

剩余18页未读，继续阅读

Lamb324

粉丝: 5
资源: 1

Kafka驱动的企业日志收集与Nginx反代实战

对应于LogAgent（收集日志），该项目用于从kafka中读取数据，发送到ES，便于后续的数据分析，如kibana.zip

基于SpringBoot+kafka+es实现的用于日志的采集和收集项目源码，采集日志零存储到磁盘，完美融合项目

依据kafka做的日志收集设计

java开发的基于kafka、xlog的web日志实时分析storm topology.zip

实时Web日志分析系统：基于Kafka、Xlog与Storm Topology开发

基于Storm和Kafka的实时Web日志分析系统

kafka跟storm收集日志解决方案

基于springboot+kafka的日志处理系统.zip

基于Spark Streaming + Kafka + Flume 实现的日志收集处理系统.zip

taotao-weblog-analysis基于openresty kafka hadoop hive 日志点击流数据分析

最新资源