随机化与三元素中位数快速排序策略比较

需积分: 0 188 浏览量更新于2024-08-05 收藏 902KB PDF 举报

"随机化快速排序的模拟与分析1" 本文深入探讨了快速排序算法的两种轴点选取策略，即随机取轴点和三元素取中位数选取轴点，并通过实验模拟研究了它们在比较次数上的期望值和方差。快速排序由Tony Hoare在1961年提出，因其高效性能而被广泛应用于如C++和Java等主流编程语言的标准库中。在最坏情况下，传统快速排序的时间复杂度为O(n^2)，但平均时间复杂度为O(n log n)。为了避免最坏情况的发生，实践中常常采用随机选取轴点的方法。这种方法假设每次都能独立且均匀地从所有元素中选择轴点，因此比较次数的期望值为2n ln n + O(n)，而方差的计算相对复杂，本文通过编程模拟来获取这一数据。另一种常见的优化策略是选择序列中三个元素的中位数作为轴点，这种方法被C++标准库采用。这种“三元素中位数划分法”旨在减少极端情况下的比较次数，提高算法效率。同样，本文也将通过模拟来分析这种方法在比较次数期望和方差上的表现。在C++实现快速排序时，可以利用运算符重载来跟踪比较次数。例如，可以创建一个名为`Int`的结构体，其中包含一个整数值`val`和一个计数器`cmp_cnt`。通过重载小于运算符，每次比较都能自动更新计数器。 ```cpp int cmp_cnt = 0; struct Int { int val; bool operator<(Int rhs) const { ++cmp_cnt; return val < rhs.val; } }; ``` 快速排序的核心操作`partition`函数如下，它将使用定义的小于运算符进行比较并重新排列数组： ```cpp Int* partition(Int* l, Int* r) { Int x = *r, *i = l; for (Int* j = l; j < r; ++j) if (*j < x) std::swap(*i++, *j); std::swap(*i, *r); return i; } ``` 通过运行大量随机生成的输入数据，模拟上述两种轴点选取策略，我们可以计算出比较次数的期望值和方差，从而对两种方法的性能进行比较。这种方法有助于理解哪种策略在实际应用中更为高效，特别是在处理大规模数据时。

随

机

化

快

速

排

序

的

模

拟

与

分

析

作

者

李

晨昊

2017011466

摘

要

本

⽂

通

过

实

验

模

拟

研

究

了

两

种

快

速

排

序

的

轴

点

选

取

策

略

(

随

机

取

轴

点

和

三

元

素

取

中

位

数

选

取

轴

点

)

的

⽐

较

次

数

的

期望

以

及

⽅

差

。

引

⾔

在

1961

年

由

Tony Hoare

发

表

的

快

速

排

序

算

法

是

迄

今

为

⽌

最

为

常

⽤

的

排

序

算

法

之⼀

，

在

C++

，

Java

等

主

流

编

程

语

⾔

的

标

准

库

中

都

有

该

算

法

的

实

例

。

对

于

通

常

的

算

法

实

现

，

简

单

的

分

析

可

以

得

出

其

最

坏

情

况

时

间

复

杂

度

为

，

⽽

平

均

意

义下

时

间

复

杂

度

为

。

通

过运

⽤

Blum

、

Floyd

、

Pratt

、

Rivest

、

Tarjan

提

出

的

最

坏

线

性

时

间

查

找

中

位

数

的

算

法

可

以

保

证

快

速

排

序

在

最

坏

情

况

下

花

费

时

间

，

但

是

通

常

情

况

下

这

⼀

算

法

带

来

的

较

⼤

的

常

数

因

⼦

使

得

这

种

⽅

案

并

没

有

被

⼴

泛

采

⽤

，

这

⾥

也

不

对

其

做

出分

析

。

实

践

中⼀

种

有

效

地

规

避

恶

意

输

⼊

下

的

算

法

花

费

时

间

的

办

法

是

随

机

选

取

轴

点

对

序

列

进

⾏

分割

。

通

过

稍

细

致

的

分

析

可

以

得

出

，

如

果

每

⼀

次

都

是

从

所

有

可

能

的

元

素

中

独

⽴

且

均

匀

地

选

取

轴

点

，

那

么

所

做

⽐

较

次

数

的

期望

为

，

⽅

差

的

推

导

则

很

困

难

。

下

⾯

将

⽤

编

程

模

拟

的

⽅

法

研

究

⽐

较

次

数

的

期望

和

⽅

差

。

朴

素

的

快

速

排

序

算

法

存

在

很

多

可

以

优

化

的

地

⽅

，

⼀

种

常

⻅

的

(C++

的

标

准

库

中

应

⽤

了

该

⽅

法

)

优

化

⽅

式

是

选

择

序

列

中三个

元

素

的

中

位

数

作

为

轴

点

，

下

⾯

也

将对

这

种

优

化

⽐

较

次

数

的

期望

和

⽅

差

进

⾏

分

析

，

以

下

对

此

都

简

称

三

元

素

中

位

数

划分

法

。

⽅

法

下

⾯

将

⽤

C++

来

实

现

代

码

。

在

普

通

的

快

速

排

序

的

基

础

上

只

需

要

记

录

⽐

较

次

数

即

可

收

集

所

需

数

据

，

这

⼀

点

可

以

利

⽤

C++

的

运

算

符

重

载

，

每

⼀

次

⽐

较

的

同

时

都

更

新

计

数

器

即

可

。

int cmp_cnt = 0;

struct Int

{

int val;

bool operator<(Int rhs) const

{

++cmp_cnt;

return val < rhs.val;

}

};

O(n )

O(n log n)

O(n )

2n ln n + O(n)

下载后可阅读完整内容，剩余9页未读，立即下载

销号le

粉丝: 35
资源: 289

随机化与三元素中位数快速排序策略比较

快速排序、冒泡排序等排序测试集

【随机化排序】：随机化快速排序的创新实现与分析

快速排序的讲解与理论分析

随机模拟和统计分析.zip

基于MATLAB的随机模拟和统计分析程序源代码包 可用于数据统计分析.rar

快速排序算法优化与实现探讨

深入浅出排序算法：快速排序优化与非递归实现

C++数组存储快速排序实现与Vector数据管理

探索排序算法可视化：Pygame实现随机数组排序

快速排序的时间复杂度分析与性能优化

最新资源

基于MATLAB的随机模拟和统计分析程序源代码包可用于数据统计分析.rar