Facebook Presto：实时大数据分析与性能优化

需积分: 15 106 浏览量更新于2024-07-15 收藏 1MB DOCX 举报

Presto是一个由Facebook开源的高性能分布式SQL查询引擎，专为大规模数据处理和分析而设计。其核心特点是通过分布式查询能力，实现对Hadoop生态系统中的数据源，如HDFS，以及非关系型数据库如Cassandra的高效访问。Presto支持数据联邦，允许用户在多个数据源之间进行联合查询，这对于数据仓库和实时数据分析场景非常适用。相比于传统的批处理工具Hive，Presto更偏向于实时交互式SQL查询，适用于快速的数据验证和实验，特别适合在线分析处理（OLAP）场景。尽管Presto提供了类似Hive的元数据管理、Thrift接口和ODBC/JDBC驱动等，但它并非关系数据库的替代品，不支持OLTP（联机事务处理）操作，而是作为数据仓库解决方案的一个补充。 Facebook版的Presto官方文档可以在<https://prestodb.io>获取，而京东和Teradata也对其进行了定制化的开发，分别在<http://prestodb-china.com>和<https://github.com/Teradata/presto>提供相关资源。Presto与Hive的结合使用中，Hive负责长期的数据准备和批量处理，而Presto则在处理后的数据集上提供快速的分析能力。 Presto的架构设计考虑到了分布式计算，通过利用行式存储和列式存储的优点，优化了数据的读取和处理性能。其SQL语法支持标准数据库特性，使得数据分析师能够无缝地进行查询操作。然而，由于其非关系型的特性和实时分析的侧重点，对于那些需要高并发写入和事务一致性要求的应用，Presto可能并不合适。总结来说，Presto是大数据时代下的一款关键工具，它扩展了数据科学家和分析师的工作效率，同时在与Hive的配合中，形成了一个完整的数据处理和分析生态系统。理解并掌握Presto的性能特点、适用场景和与其他工具的协作方式，是提升大数据分析能力的关键。

文档编号： 研究与性能测试密级分类：公开

 运行 

作为后台进程启动

*-/

在前台运行

*-/-

停止服务进程

*-/)

查看进程： )?-IO()或 :)

(4) 安装 webui

下面介绍两种 DE$54 安装和使用，选其一即可。

.(/0 主要专注于  的查询及简单的可视化分析；

-) 原来是用于支持 #-7 的可视化分析，后面发展为支持多种关系数据库及大数

据计算框架，如：0.3*P*P(PP3*P97/AP40)*P)&'P<)*-0P

2&'。

 0##$/.#柳岛

这是一个奇怪的英文名字，因为是一个日本人起的，来自东京的软件工程师

,.-,。

yanagishima 特性

安装简单（无需安装 9#$2）

易用，与 2.&'D/ 类似

使用本地存储记录独立的查询历史

可以为查询添加标签

可以查看历史查询列表

可以 Q** 正在运行的查询

可以格式化查询语句

可查看表信息（列、分区）

查询结果保存为 ;、%; 文件

+

文档编号： 研究与性能测试密级分类：公开

项目地址 /=)>(/-0.(/0.(/0

安装和运行

下载，编译，解压

详见 /=)>(/-0.(/0.(/0*09E@#2E07

配置文件

 0.(/0))8

R.(/0, 访问端口

:=.)L1++

R+0-46)3-.I7/80P.(/0*/3-.

)3-.0I?-?80?7L"++

R<$46)3-.-*M*BI7/*-P.(/0*/

3-.

)0I?-*?M*?.?BL+"

R.-)6.6*.$-.-7)6.00

)7ST7)7ST7*(ST7

/0ST

)7-L.-?)

-/.-?)L6*

R)7 地址

)7.-?)L/=)>0>1++

R*00)7-*46.--)I.P)6.

)7.-?)L/=)>0>1++

R)*(0

*(.-?)L/

R)默认访问哪个库名

/0.-?)L76-*

R63-.-*I7/*0P/,6-*))7

**0L++

R/=)/706-7*(

-7/=)/70L0-//7

--7/=)/70L6*

R*060*-3-.

*-3-.*0L++



文档编号： 研究与性能测试密级分类：公开

R-/B86-

/7-L6*

/:7-*.-?/L:7>/>0>++++76-*F-/L*

/:7-.-?/L.(/0

/:7),7.-?/L.(/0

/3-.0I?-?80?7L++

/3-.0I?-?80?7.-?/L++

-0(-*.-?/L/=)>0>"+""

3*3-.(L)

/7-L.-?/

/7**,7.,7.-?/LP7)

R<$46/3-.-*M*BI7/*-P.(/0*/3-.

/0I?-*?M*?.?BL+"

/-)3-.)/.-?/LA,.(/06

/C-)C3-.C.-?/

*7L6*

G黄色是需要修改的部分

 0,7I/0*

在第  行后面，加入以下两行数据即“EI)*H-=UV的后面

H-=.)LW-=W*LW?)0.W>7*7LW*7(-*OOX

)-C3-.*(/WY*LW-&-.I)*SZI)*

7-7ZT3*60)-C3-.WUEI)*#-7H-=U

H-=.)LW-=W*LW?)0.W>7*7LW*7(-*OOX

)-C3-.*(/WY*LW-&-.I)*SZI)*

*.BZT3*60)-C3-.WUEI)*@*.BH-=U

这样可以新增“EI)*#-7V和“EI)*@*.BV按钮，用于查看  的“分布式

执行计划”和“分布式执行计划操作成本”。

运行和停止

启动 /-).(/0?/U.*(UJJ

停止 .(/0?/-7,/

访问 DE$：

/=)>0>1++



剩余63页未读，继续阅读

jiaowoboshao

粉丝: 0
资源: 2

Facebook Presto：实时大数据分析与性能优化

Facebook Presto 研究与性能测试v2.3.docx

presto-web查询工具.zip

presto客户端

大数据项目之电商数仓（5即席查询Presto&Kylin）V4.0.docx

web的前端.docx

大数据平台技术框架选型.docx

主流开源SQL引擎分析.docx

2016前端面试题及答案.docx

企业级大数据平台实践之路.docx

聊一聊分布式对象存储解决方案.docx

最新资源