当前位置：首页 > news >正文

【C++】哈希 Hash

news 2024/10/21 17:05:27

一概念

二哈希冲突解决

1 闭散列

a 线性探测

b 二次探测

2 开散列

3 闭散列和开散列比较

三 Hash基础操作

1 unordered_map

2 unordered_set

四 Hash线性探测的模拟实现

五 Hash开散列模拟实现

1 HashTable.h

2 unordered_map.h

3 unordered_set .h

一概念

顺序结构以及平衡树中，元素关键码与其存储位置之间没有对应的关系，因此在查找一个元素时，必须要经过关键码的多次比较。顺序查找时间复杂度为O(N)，平衡树中为树的高度，即O($log_2 N$)，搜索的效率取决于搜索过程中元素的比较次数。

理想的搜索方法：可以不经过任何比较，一次直接从表中得到要搜索的元素。

如果构造一种存储结构，通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立一一映射的关系，那么在查找时通过该函数可以很快找到该元素

当向该结构中

插入元素

根据待插入元素的关键码，以此函数计算出该元素的存储位置并按此位置进行存放

搜索元素

对元素的关键码进行同样的计算，把求得的函数值当做元素的存储位置，在结构中按此位置取元素比较，若关键码相等，则搜索成功该方式即为哈希(散列)方法，哈希方法中使用的转换函数称为哈希(散列)函数，构造出来的结构称为哈希表(Hash Table)(或者称散列表)

查找的时间复杂度平均都是O(1)

哈希函数设置为：hash(key) = key % capacity; capacity为存储元素底层空间总的大小

用该方法进行搜索不必进行多次关键码的比较，因此搜索的速度比较快

二哈希冲突解决

解决哈希冲突两种常见的方法是：闭散列和开散列

1 闭散列

a 线性探测

b 二次探测

二次探测的核心思想是在哈希冲突发生时，使用一个二次函数的增量来探测下一个位置。

二次探测避免了线性探测中的一次聚集（Primary Clustering）问题，因为二次探测的探测序列是非线性的。

2 开散列

开散列法又叫链地址法(开链法)，首先对关键码集合用散列函数计算散列地址，具有相同地址的关键码归于同一子集合，每一个子集合称为一个桶，各个桶中的元素通过一个单链表链接起来，各链表的头结点存储在哈希表中。

3 闭散列和开散列比较

应用链地址法(开散列)处理溢出，需要增设链接指针，似乎增加了存储开销。事实上：由于开地址法(闭散列)必须保持大量的空闲空间以确保搜索效率，如二次探查法要求装载因子a <= 0.7，而表项所占空间又比指针大的多，所以使用链地址法反而比开地址法节省存储空间。

三 Hash基础操作

1 unordered_map

1. unordered_map是存储<key, value>键值对的关联式容器，其允许通过keys快速的索引到与其对应的value。

2. 在unordered_map中，键值通常用于惟一地标识元素，而映射值是一个对象，其内容与此键关联。键和映射值的类型可能不同。

3. 在内部, unordered_map没有对<kye, value>按照任何特定的顺序排序, 为了能在常数范围内找到key所对应的value，unordered_map将相同哈希值的键值对放在相同的桶中。

4. unordered_map容器通过key访问单个元素要比map快，但它通常在遍历元素子集的范围迭代方面效率较低。

5. unordered_maps实现了直接访问操作符(operator[])，它允许使用key作为参数直接访问value。

这里操作方法不一一赘述, 在前面的map和set章节已经讲解