1、下面的执行计划存在性能问题,已知该集群有10个dn,且 select reltuples from pg class Where relname='t1'; 结果为123456798765,请根据执行计划分析,判断性能瓶颈,并给出优化建议: id | operation | E-rows | E-memory | E-width | E-costs ----+-------------------------------+-----------+---------------+-----------|---------- 1 |->Streaming (type: GATHER) | 100 | | 12 | 114.24 2 | ->Hash Join(3,4) | 100 | 1MB | 12 | 111.05 3 | ->Seq Scan on t2 | 100000 | 1MB | 4 | 91.50 4 | ->Hash | 96 | 16MB | 8 | 3.56 5 | ->Streaming(type: BROADCAST) |100| 2MB | 8 | 3.56 6 | ->Seg Scan on t1 | 100 | 1MB | 8 | 3.06
时间: 2023-08-18 09:08:46 浏览: 60
根据给出的执行计划分析,可能存在以下性能瓶颈和优化建议:
1. 性能瓶颈分析:
- 在执行计划中,可以观察到第2步是一个Hash Join操作,其E-costs为111.05。
- 第3步是一个Seq Scan操作,扫描的行数为100,000,E-costs为91.50。
- 第4步是一个Hash操作,占用了16MB的内存。
2. 优化建议:
- 首先,考虑对查询涉及到的表t1和t2创建合适的索引,以提高查询效率。
- 对于Seq Scan操作,可以尝试优化查询条件,使用索引访问或者其他查询方式替代。
- 对于Hash Join操作,可以考虑增加内存资源分配给Hash操作,以减少磁盘IO的开销。
- 可以尝试调整集群中DN的数量和配置,以提高整体的性能表现。
综上所述,优化建议包括创建合适的索引、调整查询方式、增加内存资源分配和调整集群配置等。具体的优化策略需要根据实际情况进行分析和测试。
相关问题
1.以下sql,使用了subplan+broadcast, 请根据语义合理优化该sql, 使其运行效率更高效 select * from user01.tb1 t1 where exists (select max(id) from user01.tb2 t2 where t1.name=t2.name); 2.以下SQL, t1表使用了broadcast算子,请使用 hint 优化,避免t1表使用 broadcast select t1,id,t2.id2 from user01.tb1 t1 inner join user01.t_skew t2 on t1.id=t2.id2 and t1.name='beijing' order by 1; 3.如何判断下列语句是否下推,请写出判断方法: select count(t1.*) from user01.tb1 t1 left join user01.tb2 t2 on t1.id=t2.td and t2.name ='beijing' 4.下列语句的执行计划中,优化器选择表他作为hash内表,t2作为hash外表,请使用hint调整执行计划,使t2做hash内表 select t1.id,t2.id2 from user01.tb1 t1 inner join user01.t_skew t2 on t1.id=t2.id2 and t1.name ='beijing' order by 1 5.将schema权限赋予用户user1 将schema s2下所有表的访问权限赋予用户user1 6.gsql开创建数据库usdb,指定字符集utf-8,限制连接数20启时间检查命令 7.创建名为us01的用户,并将sysadmin权限授权给他 8.创建数据库usdb,指定字符集utf-8,限制连接数20 9.下面的语句的执行计划中州优化器选择了nestloop的关联方式,请根据语义修改语句,其实关联方式变为hashion,以提升查询性能 select * from user01.tb1 t1 where t1.id not in(select t2.id from user01.tb2 t2 where t2.name='shanghai'); 改写参考: select * from user01.tb1 t1 where not exists (select 1 from user01.tb2 t2 where t2.name='shanghai' and t1.id=t2.id) and t1.id is not null; 10.1、下面的执行计划存在性能问题,已知该集群有10个dn,且 select reltuples from pg class Where relname='t1'; 结果为123456798765,请根据执行计划分析,判断性能瓶颈,并给出优化建议: id | operation | E-rows | E-memory | E-width | E-costs ----+-------------------------------+-----------+---------------+-----------|---------- 1 |->Streaming (type: GATHER) | 100 | | 12 | 114.24 2 | ->Hash Join(3,4) | 100 | 1MB | 12 | 111.05 3 | ->Seq Scan on t2 | 100000 | 1MB | 4 | 91.50 4 | ->Hash | 96 | 16MB | 8 | 3.56 5 | ->Streaming(type: BROADCAST) |100| 2MB | 8 | 3.56 6 | ->Seg Scan on t1 | 100 | 1MB | 8 | 3.06
1. 对于这个SQL语句,可以考虑使用子查询替换exists子句,并将inner join替换为left join。优化后的SQL如下:
```sql
select t1.*
from user01.tb1 t1
left join (
select max(id) as max_id, name
from user01.tb2
group by name
) t2 on t1.name = t2.name and t1.id = t2.max_id;
```
2. 可以使用`NO_BROADCAST_JOIN` hint来避免t1表使用broadcast算子。优化后的SQL如下:
```sql
select /*+ NO_BROADCAST_JOIN(t1) */ t1.id, t2.id2
from user01.tb1 t1
inner join user01.t_skew t2 on t1.id = t2.id2 and t1.name = 'beijing'
order by 1;
```
3. 判断是否下推可以通过查看执行计划中join类型来确定。如果join类型是LEFT JOIN,且右表的过滤条件出现在执行计划的Filter节点中,则说明该条件未下推。如果右表的过滤条件出现在执行计划的Join节点中,则说明该条件已下推。
4. 可以使用`LEADING(t2)` hint来指示优化器选择t2作为hash内表。优化后的SQL如下:
```sql
select t1.id, t2.id2
from user01.tb1 t1
inner join /*+ LEADING(t2) */ user01.t_skew t2 on t1.id = t2.id2 and t1.name = 'beijing'
order by 1;
```
5. 赋予用户user1 schema权限的SQL如下:
```sql
GRANT USAGE ON SCHEMA schema_name TO user1;
```
赋予用户user1 schema s2下所有表的访问权限的SQL如下:
```sql
GRANT SELECT, INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA s2 TO user1;
```
6. 创建数据库usdb的SQL如下:
```sql
CREATE DATABASE usdb WITH ENCODING 'UTF8' CONNECTION LIMIT 20;
```
7. 创建用户us01并授予sysadmin权限的SQL如下:
```sql
CREATE USER us01;
GRANT sysadmin TO us01;
```
8. 创建数据库usdb的SQL如下:
```sql
CREATE DATABASE usdb WITH ENCODING 'UTF8' CONNECTION LIMIT 20;
```
9. 改写后的SQL如下:
```sql
select t1.*
from user01.tb1 t1
left join (
select id
from user01.tb2
where name = 'shanghai'
) t2 on t1.id = t2.id
where t2.id is null and t1.id is not null;
```
10.1、根据执行计划分析,性能瓶颈可能在Hash Join操作上,它的成本较高。建议可以考虑增加内存大小,以减少磁盘I/O的开销,或者调整查询语句,使用索引来加速查询。另外,也可以考虑对数据进行分区或分片,以提高查询效率。
select tablename from pg_tables where schemaname='public' and tablename not in (SELECT child.relname AS child_table FROM pg_inherits JOIN pg_class parent ON pg_inherits.inhparent = parent.oid JOIN pg_class child ON pg_inherits.inhrelid = child.oid JOIN pg_namespace nmsp_parent ON nmsp_parent.oid = parent.relnamespace JOIN pg_namespace nmsp_child ON nmsp_child.oid = child.relnamespace) order by 1;
这是一条 PostgreSQL 数据库查询语句,用于查找指定 schema(在此为 public)下的所有表名,并排除继承关系的表。其具体作用如下:
1. 通过 `pg_tables` 系统目录表,筛选指定 schema(在此为 public)下的所有表名,使用 `schemaname` 和 `tablename` 进行筛选。
2. 使用子查询查找继承关系的表,即父表和子表,使用 `pg_inherits` 系统目录表来查找这个关系。通过 `inhparent` 和 `inhrelid` 可以找到父表和子表的 `oid`。然后使用 `pg_class` 系统目录表找到表的详细信息,包括表名和 schema。最后,使用 `pg_namespace` 系统目录表来查找 schema 的详细信息,并与表的详细信息一起使用以获取完整的表名。
3. 将不在子查询结果中的所有表名按照字母顺序排序,并返回结果。
该查询语句的作用是查找指定 schema 下的所有非继承关系的表名。在数据迁移过程中,可以使用此查询来列出需要进行数据清理和转换的表,以便执行后续的数据迁移操作。
相关推荐
![doc](https://img-home.csdnimg.cn/images/20210720083327.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)