C++ STL容器总结

Hints:在本文中,重点总结的是各个容器中增删查的算法时间复杂度。

在c++中,容器指的是能够容纳各种数据类型的通用数据数据结构,是类模板。 比如set类模板:

template <class _Key, class _Compare = less<_Key>,
          class _Allocator = allocator<_Key> >
class _LIBCPP_TYPE_VIS_ONLY set
复制代码

C++的容器主要分为三种:

  • 顺序容器
  • 关联容器
  • 容器适配器

而访问容器元素我们需要迭代器(引入容器头文件就可以了,不需要单独因为头文件),迭代器有以下几个属性:

  • 用于指向顺序容器和关联容器的元素
  • 用法和指针类似
  • 有const(容器类名::iterator 变量名)和非const两种(容器类名::const_iterator 变量名)
  • 通过迭代器可以读取它指向的元素
  • 非const迭代器和可以修改其指向的元素

顺序容器

何为顺序容器,也就是说元素的位置是顺序插入的,插入位置与元素的值无关,核心是容器没有排序。 顺序容器都具有以下10个成员函数:

#返回迭代器
begin
end
rbegin  //返回指向最后一个元素的迭代器
rend
#返回元素引用
front
back
#其他
erase(删除区间时返回被删除元素后面的迭代器;也可删除一个或几个元素)
clear
push_back
pop_back
复制代码

顺序容器有以下三种:

1.vector动态数组 头文件<vetor>

元素在内存中是连续存放的。

随机存取时间:常数时间(因为可以通过下标直接访问到地址)。

在尾部增删元素通常是常数时间(正常是常数时间,如果超出了默认分配的元素个数,会重新分配存储空间,此时会消耗更多时间)。

在中间或者头部增删元素:o(n)(会移动其他元素的位置)。

迭代器类型:随机访问(支持下标访问、随机移动,例:a[i])。

查询时间:o(n)(因为没有排序,只能现行查找,效率较低)。

可见vector在中间或者头部增删元素性能较低。

优点:内存和C完全兼容、高效随机访问、节省空间

缺点:内部插入删除元素代价巨大、动态大小查过自身容量需要申请大量内存做大量拷贝

构造函数:

 vector();
 vector(int n);
 vector(int n, const T &a); //把n个元素初始化为a
 vector(iterator first,iterator last); //初始化为其他容器上区间[first,last)一致的内容
复制代码

常用成员函数

void pop_back();
void push_back(const T &val);
int size();
T & font();
T & back();
复制代码

deque[读:dek,之前经常读dkju:]双向队列 头文件<deque>

元素在内存中连续存放(连续内存的容器有个明显的缺点,就是有新元素插入或老元素删除的时候,为了给新元素腾出位置或者填充老元素的空缺,同一块内存中的其他数据需要进行整体的移位,这种移位的拷贝代价有时是非常巨大的。deque实际上是分配到不同内存块,通过链表把内存块连在一起,再进行连续存放,是list与vector的折中)。

随机存取时间:常数时间(仅次于vector,因为有可能存在尾部的内存位置在头部之前的场景)。

在两端增删元素通常是常数时间。(deque不像vector没有容量,不需要重新分配内存空间。这是因为deque由动态分配的连续空间,即缓冲区,组合而成,随时可以增加一段新的空间链接起来。它没有必要像vector那样“因旧空间不足而重新分配2倍的空间,然后复制元素,再释放旧空间”。当重新分配缓冲区时,耗时增加)。

在中间插入:时间复杂度较高。

迭代器类型:随机访问(效率低于vector)。

查询时间:o(n)(原因同上)。

**优点:高效随机访问、内部插入删除元素效率方便、两端push、pop效率很高 **

**缺点:内存占用比较高 **

list双向链表 头文件<list>

元素在内存中不连续分配(因为指针可以获取前后元素的地址),所以不支持随机存取

在任何位置增删元素时间:常数时间。

查询时间:o(n)(原因同上)。

迭代器类型:双向(不支持下标访问,不支持迭代器的比较运算符,和+-运算符)

优点:任意位置插入删除元素常量时间复杂度、两个容器融合是常量时间复杂度

缺点:不支持随机访问、比vector占用更多的存储空间

常用成员函数:(注意这些在顺序容器中都是list独有的)

push_front
pop_front
sort   //不支持STLsort算法
remove
unique
merge
reverse
splice
复制代码

特别说明,list的sort函数有无参和compare两个版本

list<T> classname
classname.sort(compare);  //compare自定义
classname.sort();
复制代码

关联容器(迭代器类型:双向)

关联的意思就是元素是排序的。

插入与检索元素时间: o(log(N))(因为通过红黑二叉树实现,时间与平衡二叉树一致)。

需要注意的是,STL中有些算法比如sort,binary_search需要通过随机访问迭代器访问容器中的元素,因此list以及关联容器就不能支持该算法!

主要包括以下4种:

  • set
  • multiset
  • map
  • multimap

除了个容器都有的成员函数外,它们都有以下成员函数

find
lower_bound
upper_bound
equal_range
count
insert
复制代码

map与set的不同点在于,map中存放的元素有且仅有两个成员变量,first(类似于key),second(类似于value),map可以根据first对元素排序和检索。

set与multiset的不同在于,后者允许存在相同值的元素。 map与multimap的不同在于,后者允许存在相同的first值的元素。

容器适配器(不支持迭代器)

这个概念听起来有点抽象,其实就是STL帮我们抽象了实际工作中所需要的数据操作方式。举个栗子,交流电可以有任意的传输电压,但是实际生活中我们只需要220v就够了,变压器帮我们实现了这个基本的功能。同理,容器的操作方式多种多样,但是其实我们只需要他们按照实际的一些规范来操作即可。

他们都有以下3个成员函数:

push
top
pop
复制代码

STL中的排序,查找,变序算法都不适合容器适配器(因为容器适配器的元素位置不可随意改变,并且访问有一定的访问规则,不支持随机访问)。

stack 栈 头文件<stack>

是一个有限序列,并满足序列中被删除、检索和修改的项只能是最近插入序列的项(栈顶项)。也即,先进先出LIFO

可以用vector,deque,list(性能最差)实现,编译器缺省是用deque实现的。

比如,在程序调试中,错误堆栈就是一种应用。

queue 队列 头文件 <queue>

插入只可以在尾部进行,删除、检索和修改只允许从头部进行。先进先出FIFO

queue由于pop,push发生在对头,所以不能用vector实现,可以用list,deque实现,编译器缺省用deque实现。

比如,应用于需要保证消息顺序性的场景,如消息队列。

priority_queue 优先级队列 头文件<queue>

最高优先级元素总是第一个出列。

它需采用堆排序来保证元素总是在最前面,因此要求随机访问,所以不能使用list实现,可以用vector和deque实现,编译器缺省情况下用vector实现。

比如,操作系统的线程的调度算法,有的是按照优先级来调度的。

总结

  • 如果需要随机访问,用vector

  • 如果存储元素的数目已知,用vector

  • 需要任意位置随机插入删除,用list

  • 经常在容器的首部尾部插入删除元素,用deque

  • 元素结构复杂用list,也可以用vector存储指针(需要额外的精力去维护内存),看需求

  • 如果操作是基于键值,用set/map

  • 如果需要经常的搜索,用map/set

参考:

C++ STL容器时间复杂度下的最佳选择

深入理解deque容器

优先队列及最小堆最大堆

猜你喜欢

转载自juejin.im/post/6844903549269180424