【数据结构】插入排序——直接插入排序 和 希尔排序
直接插入排序 和 希尔排序
- 一、直接插入排序
- 二、直接插入排序的弊端
- 三、希尔排序
- (1)对插入排序的联想
- (2)希尔排序的思路
- 四、直接插入排序和希尔排序效率对比
- 1>随机生成10000个数
- 2>我们随机生成100000个数
- 3>我们随机生成1000000个数
- 4>希尔排序的时间复杂度
一、直接插入排序
我们要如何理解直接插入排序呢?
假设tmp之前的数都被我们拍好了,tmp就是我们要插入的数
让tmp之前的数与tmp进行对比,若比tmp大就将他们向后移动
当遇到比tmp小的数就将tmp插入到该数的后面
这样能保证tmp所在的位置:
前面是比tmp小的数
后面是比tmp大的数
当走完循环就可以完成排序
动图演示:
//插入排序
void InsertSort(int* a, int n)
{for (int i = 0; i < n - 1; i++){//保存已经拍好序的前 i 个数的下标int end = i;//保存要插入的数,一会儿会被覆盖int tmp = a[i + 1];//单次循环while (end >= 0 && a[end] > tmp){//若前一个数比 tmp 大则将该数填到后面,t--a[end + 1] = a[end--];}a[end + 1] = tmp;}
}
我们看到我们这里的循环条件是 i < n - 1
因为当 i 为倒数第二个数时
插入的数为倒数第一个数
代码运行:
二、直接插入排序的弊端
直接插入排序有什么弊端呢?
我们想如果我们要排一个升序:
1>
数组中是升序排列的数:
那么我们每次进入循环都不需要额外进行移动
也就是不用进入循环,移到次数为 0
那么它的时间复杂度是O(N)
2>
数组中是降序排列的数:
那么我们每次进入循环都要进行移动
并且假设我们要将第 i 个数插入,移动次数为 i - 1
那么它的时间复杂度是O(N ^ 2)
所以直接插入排序的效率是很不稳定的
三、希尔排序
(1)对插入排序的联想
但是插入排序真的不可取吗?
插入排序在最好的情况时间复杂度时O(N)
但是插入排序的效率受到数组原顺序的影响很大
假如要拍一个升序,而最大的数在第一位
那么最大的这个数要移动的次数很多
那么我们想,如果我们可以让插入排序的时间复杂度接近O(N)
那它的效率一定非常高
所以我们想到:
如果我们可以让原来要移动很多次数的数移动的次数变少,就可以提高它的效率
(2)希尔排序的思路
如果我们想让原来要移动次数很多的数,它的移动次数变少
那么我们就要改变它的移动步子大小
我们把步子的这个大小叫gap
我们假设gap = 3
进行一次插入
将 end = i + gap 位置的数插入,使得和 i = 0 位置的数进行交换
最终效果:
我们发现最大的数原先需要 9 次才能移动到最后
但现在仅仅需要三次就到最后了
这样就使我们的排序效率提高
那我们下一次只要从 i = 1 的位置开始
一直到 i < gap
这样就把整个数组进行了初次排序
我们先来分析一次步子大小为 gap 的排序
下面是一次插入的代码:
//每次跳的步子大小
int gap;
for (int j = 0; j < gap; j++)
{//单次排序for (int i = j; i < n - gap; i += gap){//保存拍好序的前面最后数的下标int end = i;//保存要插入数的值int tmp = a[i + gap];//循环while (end >= 0 && a[end] > tmp){a[end + gap] = a[end];end -= gap;}a[end + gap] = tmp;}
}
先看内层:
从单次排序开始
每次将 end = i + gap 处的数插入
与 i = 0 进行比较
随后再将 i += gap
相当于将 end = i + gap + gap 处的数插入
那么在什么时候截止呢?
这时我们要往外层看
我们又进行了一层循环
我们设 j = 0 就是第一次开始插入的位置
为了将整个数组都进行该处理
我们每次将 j++
当 j < gap 时就将 0 到 gap - 1 前的数都处理了
也将整个数组都进行了一次 gap 步的排序
如果不理解可以将上面图中 gap = 3 的情况带入理解
那么我们再反过来看 i 的停止条件
以 gap 等于 3 为例
当 i = 1 或者 i = 2 时
再后面 end = i + gap时,会超出范围
所以当 i < n - gap 时,就可以处理完全部的数
接下来看下面的图:
有没有发现什么,是不是当 gap = 1 时两边的代码就一样了
所以我们接下来就要考虑 gap 的取值了
经过人们的研究,人们发现 gap 每次取 1 / 3 时效率最高
所以就有了下面的代码:
//希尔排序
void ShellSort(int* a, int n)
{int gap = n - 1;while (gap != 1){//每次跳的步子大小gap = gap / 3 + 1;for (int j = 0; j < gap; j++){//单次排序for (int i = j; i < n - gap; i += gap){//保存拍好序的前面最后数的下标int end = i;//保存要插入数的值int tmp = a[i + gap];//循环while (end >= 0 && a[end] > tmp){a[end + gap] = a[end];end -= gap;}a[end + gap] = tmp;}}}
}
为什么我们要取 gap 时要 gap / 3 + 1
因为当 gap 等于 2 时,再除 3 会等于 0
那么这个 +1 就是为了使 gap 最终会等于 1
动图演示:
四、直接插入排序和希尔排序效率对比
1>随机生成10000个数
让直接插入排序和希尔排序进行比较:
2>我们随机生成100000个数
3>我们随机生成1000000个数
再往后的就不测了,插入排序跑不动了
4>希尔排序的时间复杂度
直接说结论希尔排序的时间时间复杂度为:
O(N ^ 1.3)
很抽象,这个我是不会算,当时听到也感觉惊为天人
但是我们可以探究一下
第一次 gap 我们的最大交换次数
(gap / 3) * 3 此时gap为n
gap / 3 为组数,而 *3是没组最大的交换次数
第二次 gap 我们的最大交换次数
(gap / 3 / 3)* 3 * 3
理应是这样的对吧?
可是要是真的是这样我们第一次不是白处理了嘛
第一次我们已经将要移动次数较多的数移动到后面了
那这个最大交换次数是不可能的
所以就会变得快