Oracle高效查询与删除表中重复数据的方法

版权申诉

31 浏览量更新于2024-09-14 2 收藏 74KB PDF 举报

在处理Oracle数据库中的重复数据时，通常涉及到查询和删除重复记录。首先，要找到表中重复的数据，可以使用`SELECT`语句结合`GROUP BY`和`HAVING`子句来实现。例如，如果有一个名为`person`的表，包含`id`和`name`两个字段，其中`id`是唯一标识，那么可以通过以下命令找出重复的`id`： ```sql SELECT id, COUNT(*) FROM person GROUP BY id HAVING COUNT(*) > 1; ``` 这里的`HAVING COUNT(*) > 1`条件表示如果有超过1条记录具有相同的`id`，则认为是重复。如果你想查询没有重复的记录，只需将`> 1`改为`= 1`。针对删除重复数据，常规的方法是直接删除，但考虑到性能问题，尤其是处理大量数据时，建议先将重复数据暂存到临时表中，然后再进行删除操作。创建临时表的命令如下： ```sql CREATE TABLE temp_table AS SELECT 字段1, 字段2, COUNT(*) FROM person GROUP BY 字段1, 字段2 HAVING COUNT(*) > 1; ``` 然后使用`DELETE`语句结合`IN`子句从原始表中删除重复数据： ```sql DELETE FROM person WHERE 字段1, 字段2 IN (SELECT 字段1, 字段2 FROM temp_table); ``` 然而，如果你希望保留重复数据中最新的记录（基于某些特定条件，比如rowid），Oracle数据库提供了一种方法。由于每个记录都有隐藏的rowid字段，可以通过比较rowid值来实现这一目标。保留最新记录的删除语句如下： ```sql DELETE FROM person WHERE rowid NOT IN (SELECT MAX(b.rowid) FROM person b WHERE a.字段1 = b.字段1 AND a.字段2 = b.字段2); ``` 这个查询会找出每个重复组中rowid最小的记录，并保留其他所有的记录。这种方法保留了最新的记录，但请注意，rowid通常是数据库内部使用的唯一标识，可能不适合直接作为业务决策依据。在实际应用中，根据业务需求选择合适的方法来处理重复数据。

Oracle查询表里的重复数据方法查询表里的重复数据方法

一、背景一、背景

　　一张person表，有id和name的两个字段，id是唯一的不允许重复，id相同则认为是重复的记录。

二、解决二、解决

　　select id from group by id having count(*) > 1

　　按照id分组并计数，某个id号那一组的数量超过1条则认为重复。

如何查询重复的数据

select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

PS：将上面的>号改为=号就可以查询出没有重复的数据了。

Oracle删除重复数据的删除重复数据的SQL（删除所有）：（删除所有）：

删除重复数据的基本结构写法：

想要删除这些重复的数据，可以使用下面语句进行删除

delete from 表名 a where 字段1,字段2 in

(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

上面的SQL注意：语句非常简单，就是将查询到的数据删除掉。不过这种删除执行的效率非常低，对于大数据量来说，可能会

将数据库吊死。

建议先将查询到的重复的数据插入到一个临时表中，然后对进行删除，这样，执行删除的时候就不用再进行一次查询了。如

下：

CREATE TABLE 临时表 AS (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

上面这句话就是建立了临时表，并将查询到的数据插入其中。

下面就可以进行这样的删除操作了：

delete from 表名 a where 字段1,字段2 in (select 字段1，字段2 from 临时表);

Oracle删除重复数据的删除重复数据的SQL（留下一条记录）：（留下一条记录）：

oracle中，有个隐藏了自动rowid，里面给每条记录一个唯一的rowid，我们如果想保留最新的一条记录，我们就可以利用这个

字段，保留重复数据中rowid最大的一条记录就可以了。

使用ROWID查询重复数据：

select a.rowid,a.* from 表名 a

where a.rowid !=

(select max(b.rowid) from 表名 b

where a.字段1 = b.字段1 and

a.字段2 = b.字段2 )

括号中的SQL查询出rowid最大的记录，而外面就是查询出除了rowid最大之外的其他重复的数据了。

由此，我们要删除重复数据，只保留最新的一条数据，就可以这样写了：

删除重复数据（留下最大ROWID的一条）

delete from 表名 a where a.rowid !=

(select max(b.rowid) from 表名 b

where a.字段1 = b.字段1 and

a.字段2 = b.字段2 )

删除重复数据（留下最小ROWID的一条）

delete tab t where t.rowid > (

select min(t2.rowid) from tab t2 where t.col2 = t2.col2 and t.col8 = t2.col8

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38654855

粉丝: 6
资源: 888

Oracle高效查询与删除表中重复数据的方法

Oracle查询重复数据与删除重复记录方法（txt）

Oracle查询重复数据与删除重复记录方法

oracle中如何删除重复数据

oracle常用sql查询语句部分集合(图文)

最全的oracle常用命令大全.txt

如何查出同一张表中字段值重复的记录

来者不拒，大小通吃——谈SQL Server的数据导入.pdf

如何在表里创建复合主键

ORACLE删除重复数据

oracle 删除重复数据

最新资源