Facebook的Scribe：分布式日志收集系统解析

需积分: 10 174 浏览量更新于2024-09-11 收藏 22KB DOCX 举报

"Scribe日志记录讲解 - 分布式日志收集系统，支持Thrift框架，适用于大规模数据收集和分析" Scribe是一个由Facebook开源的分布式日志收集系统，其核心设计目标是提供一个简单而高效的方式来聚合各种服务的日志数据。它允许各个服务通过Thrift接口将日志数据推送到Scribe服务器，从而实现跨语言和跨平台的数据收集。Scribe的灵活性在于其日志格式的可定制性，可以根据实际需求定义日志格式，使其适应各种不同的分析场景。 Scribe有两种主要的架构模式： 1. 单Server架构：适用于日志生成压力较小的环境。在这种模式下，用户或服务产生的日志首先被WebServer接收，然后通过Scribe服务器进行处理，最终存储并进行后续的分析和展示。开发人员可以通过Thrift自动生成记录日志所需的程序框架，简化集成过程。 2. 客户端/服务器（C/S）结构：适用于高流量的网站和服务，能够通过负载均衡和水平扩展来应对更大的日志处理需求。在这种模式下，多个WebServer可以将日志通过Scribe客户端发送到一组Scribe服务器，服务器端也可以通过添加更多节点来扩展处理能力。客户端和服务器都可以根据需要进行水平扩展，并通过散列策略来分布日志处理负载。 Scribe的高性能主要得益于其使用了epoll系统调用，这是一种高效的I/O多路复用技术，尤其在处理大量并发连接时表现出色。在安装配置Scribe时，特别是对于FreeBSD系统，可以使用`pkg_add`命令直接安装二进制包，包括Scribe、Thrift和fb303。而在Ubuntu和CentOS等其他Linux发行版上，可能需要手动安装依赖包，包括Python、Boost、Perl等。在FreeBSD系统中，还需要手动提取并配置Scribe和Thrift的源代码。在实际使用Scribe时，开发者需要编写日志生成程序，使用Thrift库创建与Scribe通信的客户端，将日志数据推送到Scribe服务器。Scribe服务器会负责将接收到的日志数据转发到指定的存储系统，如Hadoop，以便进行进一步的分析和挖掘。这个过程通常涉及对日志数据的清洗、转换，以及可能的实时分析，以提取有价值的信息，例如用户行为分析、系统监控、故障排查等。总结来说，Scribe是一个强大而灵活的分布式日志管理系统，它通过Thrift框架实现了多语言支持，适应于大规模服务的日志收集和分析，尤其适合需要高效处理和解析大量日志数据的场景。无论是小型服务还是大型互联网应用，Scribe都能提供可靠且可扩展的日志处理解决方案。

简单说一下， 是  开源的分布式日志搜集系统，架构简单，日

志格式灵活，且支持异步发送消息和队列。非常适合用于用户行为分析的基础

数据收集，支持 。配合 ，可以跨语言和平台进行数据收集，非常

优秀，性能也非常卓越。

 提供两种不同的架构可供选择，单 ，或 。从系统调用上说，

 之所以性能卓越，是因为采用了  方式，这个就不解释了。简单描

述一下  可以设置的几种架构方式。

不过要明确一个概念， 不是抓取日志的东西，而是  日志的东西

一、架构设计

，适用于压力较小的网站或服务。日志流程如下

用户 存储 分析 展示

用户 

记录日志的程序框架由  自动生成，只需  或者  即可。

 结构，适合访问量大的网站和服务，并可根据需要进行平行扩展，采用

散列的方式分配服务器压力。

用户 存储分析展示

用户  

用户 !

 及  均可进行水平扩展，在程序中设置  访问。

下载后可阅读完整内容，剩余6页未读，立即下载

liyonghui123

粉丝: 24
资源: 51

Facebook的Scribe：分布式日志收集系统解析

scribe客户端所需jar包

scribejava：Java的简单OAuth库

scribe-1.3.5.jar

scribe日志系统文档

Thrift+Scribe分布式日志系统的构建

scribe:node.js 日志模块

scribe-log4j:将日志消息发送到 Scribe 的 log4j appender

ddth-log2scribe:Log4j & Slf4j 适配器将日志写入 scribe 服务器

scribe.js-amqp-aggregator:AMQP + Scribe.js 用于轻量级日志管理

scribe-bus:在redis pub-sub和Scribe-js上运行的Light日志管理器，以确保您拥有一个智能仪表板来查看所有日志

最新资源