【C++】STL之vector功能及模拟实现

目录

前沿

一、vector的使用

 1、vector 构造函数的声明

 2、vector 迭代器的使用

 3、vector 空间增长问题

 4、vector 的增删查改

二、vector的模拟实现

 1、vector 的成员变量

 2、迭代器

 3、容量相关(resize, reserve)

 4、数据访问相关

 5、插入删除

  5.1 任意位置插入

  5.2 任意位置删除

  5.3 尾插

  5.4 尾删

 6、析构函数

 7、交换函数

 8、构造函数

  8.1 无参构造

  8.2 实参构造

  8.3 迭代器区间构造

  8.4 实参构造的特例化

  8.5 拷贝构造

 9、赋值运算符重载

三、vector迭代器失效问题(重点)

  1、会引起其底层空间改变的操作,都有可能是迭代器失效。

  2、 指定位置元素的删除操作–erase

四、使用memcpy拷贝问题


前沿

  1. vector是表示可变大小数组的序列容器。
  2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
  3. vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小 为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是 一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
  4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存 储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是 对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
  5. vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增 长。
  6. 与其它动态序列容器相比(deque, list and forward_list),vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起 list 和 forward_list 统一的迭代器和引用更好。

一、vector的使用

 1、vector 构造函数的声明

(constructor)构造函数声明 接口说明
vector(); 无参构造
vector (size_type n, const value_type& val = value_type()); 构造并初始化n个val
vector (const vector& x); 拷贝构造
vector (InputIterator first, InputIterator last); 使用迭代器进行初始化构造
#include <iostream>
#include <vector>
using namespace std;

int main()
{
	vector<int> v;
	vector<int> v2(5, 0);
	vector<int> v3(v2);
	vector<int> v4(v2.begin(), v2.end());

	return 0;
}

调试结果如下:

 2、vector 迭代器的使用

iterator的使用 接口说明
begin + end 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置的iterator/const_iterator
rbegin + rend 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的reverse_iterator

 对于 vector 迭代器的使用,主要是遍历 vector,在这里有两种遍历方法:一种是按数组下标方式,另一种是通过范围 for 的方式(底层也是迭代器)。

int main()
{
	vector<int> v(5, 1);
	for (size_t i = 0; i < v.size(); ++i)
	{
		cout << v[i] << " ";
	}
	cout << endl;

	vector<int>::iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

运行结果如下:

 3、vector 空间增长问题

容量空间 接口说明
size 获取数据个数
capacity 获取容量大小
empty 判断是否为空
resize 改变vector的size
reserve 改变vector的capacity

  这一块主要是 resize 和 reserve 函数接口的使用。

  首先介绍一下 vs 下 vector 的扩容机制 :capacity 是按 1.5 倍增长的,而 g++ 是按 2 倍增长的。

//测试vector的默认扩容机制
void TestVectorExpand()
{
	size_t sz;
	vector<int> v;
	sz = v.capacity();
	cout << "making v grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			sz = v.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

运行结果:

  resize 的使用:

int main()
{
	vector<int> v;
	for (int i = 0; i < 10; i++)
		v.push_back(i);

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;
	cout << v.capacity() << endl << endl;

	v.resize(15);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl; // 大小扩大至15,所以后面要补5个0
	cout << v.size() << endl;
	cout << v.capacity() << endl << endl;

	v.resize(5);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;  // 因为resize值改变size的大小,所有size=5
	cout << v.capacity() << endl << endl; // 由于上面将容量扩增为19,而resize不会改变capacity的大小

	v.resize(8, 88);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

运行结果:

  reserve 的使用:

int main()
{
	vector<int> v;
	for (int i = 0; i < 10; i++)
		v.push_back(i);

	cout << v.size() << endl;
	cout << v.capacity() << endl << endl;

	v.reserve(15);
	cout << v.size() << endl;
	cout << v.capacity() << endl << endl;

	v.reserve(5);
	cout << v.size() << endl;
	cout << v.capacity() << endl << endl;
	return 0;
}

运行结果:

注意:reserve 只改变 capacity 的大小,不改变 size 的大小,只能增加 capacity,不能减小 capacity。

 4、vector 的增删查改

vector增删查改 接口说明
push_back 尾插
pop_back 尾删
find 查找。(注意这个是算法模块实现,不是vector的成员接口)
insert 在position之前插入val
erase 在position之前插入val
swap 交换两个vector的数据空间
operator[] 像数组一样访问

尾插和尾删:push_back/pop_back

int main()
{
	vector<int> v;
	for (size_t i = 0; i < 10; i++)
	{
		v.push_back(i);
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	v.pop_back();
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

运行结果:

任意位置插入:insert和erase,以及查找find

任意位置的插入和删除一般是要配合 find 函数使用,如下:

int main()
{
	vector<int> v = { 1, 2, 3, 4 };

	// 在指定位置前插入值为val的元素,比如:3之前插入30,如果没有则不插入
	// 1. 先使用find查找3所在位置
	// 注意:vector没有提供find方法,如果要查找只能使用STL提供的全局find
	auto pos = find(v.begin(), v.end(), 3);
	if (pos != v.end())
	{
		// 2. 在pos位置之前插入30
		v.insert(pos, 30);
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	pos = find(v.begin(), v.end(), 3);
	// 删除pos位置的数据
	v.erase(pos);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

运行结果:

二、vector的模拟实现

 1、vector 的成员变量

template<class T>
class vector
{
private:
	iterator _start;
	iterator _finish;
	iterator _end_of_storage;
};

  _start 表示这段空间的第一个元素的位置,_finish 表示这段空间有效元素的下一个空间位置,而 _end_of_storage则表示整段空间的下一个位置。

 2、迭代器

// Vector的迭代器是一个原生指针
typedef T* iterator;
typedef const T* const_iterator;

iterator begin()
{
	return _start;
}
iterator end()
{
	return _finish;
}
const_iterator begin()const
{
	return _start;
}
const_iterator end()const
{
	return _finish;
}

 3、容量相关(resize, reserve)

size_t size() const
{
	return _finish - _start;
}
size_t capacity() const
{
	return _end_of_storage - _start;
}
bool empty() const
{
	return _start == _finish;
}

void reserve(size_t n)//开空间
{
	if (n > capacity())
	{
		size_t sz = size();
		//开辟新空间
		T* tmp = new T[n];
		if (_start)
		{
			for (size_t i = 0; i < sz; ++i)
			{
				tmp[i] = _start[i];
			}
			//释放原有空间
			delete[] _start;
		}
		_start = tmp;
        //_finish = _start + size(); 这种是错误写法
		_finish = _start + sz;
		_end_of_storage = _start + n;
	}
}
void resize(size_t n, T val = T())//开空间+初始化
{
	//如果n小于当前的size,则数据个数缩小到n
	if (n < size())
	{
        //删除数据
		_finish = _start + n;
	}
	else
	{
		//先扩容
		if (n > capacity())
		{
			reserve(n);
		}
		//再将size扩大到n
		while (_finish != _start + n)
		{
			*_finish = val;
			++_finish;
		}
	}
}

注意:在 reserve 函数中,在最后给 _finish 赋值的时候,我们第一感觉就是 _start + size(),但是这种写法是错误的,因为 size() = _finish - _start,此时_start 已经更新过了,而_finish 还是原先的数据,所有会出现错误,在这里我们的解决方法,就是先保存一下 size()。

 4、数据访问相关

T& operator[](size_t pos)
{
	assert(pos < size());
	return _start[pos];
}
const T& operator[](size_t pos)const
{
	assert(pos < size());
	return _start[pos];
}
T& front()
{
	return *_start;
}
const T& front()const
{
	return *_start;
}
T& back()
{
	return *(_finish - 1);
}
const T& back()const
{
	return *(_finish - 1);
}

 5、插入删除

  5.1 任意位置插入

iterator insert(iterator pos, const T& val)
{
	assert(pos >= _start);
	assert(pos <= _finish);
	//检查容量够不够
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		//扩容后更新pos位置,解决pos失效的问题
		pos = _start + len;
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}
	*pos = val;
	++_finish;
	return pos;
}

注意:在扩容后一定要更新 pos 的位置,否则就会出现迭代器失效的问题。大家想想为啥扩容了要更新pos?假如不更新pos,当扩容了后pos的值肯定会发生改变,那么我们就不能够使用原先的pos来访问数据了,否则就非法越界了。

  5.2 任意位置删除

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator start = pos + 1;
	while (start != _finish)
	{
		*(start - 1) = *start;
		++start;
	}
	--_finish;
	return pos;
}

  5.3 尾插

void push_back(const T& x) 
{ 
	insert(end(), x); 
}

  5.4 尾删

void pop_back() 
{ 
	erase(end() - 1); 
}

 6、析构函数

~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

 7、交换函数

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

 8、构造函数

  8.1 无参构造

vector()
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{}

  8.2 实参构造

vector(size_t n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	reserve(n);
	for (int i = 0; i < n; i++)
	{
		push_back(val);
	}
}

  我们在写构造函数的时候为了防止野指针的出现,需要在初始化列表中将三个指针全部初始化为空。为了减少频繁扩容所带来的消耗,可以先调用reserve函数预先开辟一块空间,然后依次将要初始化的对象进行尾插。这里我们可以要初始化的值val预先设定缺省参数,这里我们不能将缺省值设置为0,因为要初始化的对象可能是int类型、double类型、还有可能是一个自定义类型,所以这里我们可以将缺省值给定为一个T类型的匿名对象。

  注意:引用会延长匿名对象的生命周期到引用对象域结束,因为这里的 val 就是匿名对象的别名,如果匿名对象在当前行就之后就销毁的话,val也会被销毁。同时,因为匿名对象具有常性,所以我们需要用 const 来修饰 val 。

  8.3 迭代器区间构造

template <class InputIterator>
vector(InputIterator first, InputIterator last)
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

  我们提供以上的迭代器模版,如果我们尝试构造一个内容为5个10的对象时候(vector<int> v(5, 10)),这里就会出现间接寻址的错误,因为编译器在进行模板实例化以及函数参数匹配时会调用最匹配的那一个函数,当我们将T实例化为 int 之后,由于两个参数都是 int ,所以迭代器构造函数会直接将 Inputlterator 实例化为 int ,但是如果 n 个 val 构造来说,不仅需要将T实例化为 int,还需要将第一个参数隐式转换为 size_t;所以编译器会优先调用迭代器区间构造函数,直接对 int 类型解引用的话就会报错。

  因此,为了防止这种情况的发生,就引出实参构造的特例化。

  8.4 实参构造的特例化

vector(int n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	reserve(n);
	for (int i = 0; i < n; i++)
	{
		push_back(val);
	}
}

  与上面的 vector(size_t n, const T& val = T()) 函数构成重载,使编译器能够进行模版模版匹配 。

  8.5 拷贝构造

//拷贝构造
vector(const vector<T>& v)//浅拷贝
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	_start = new T[v.capacity()];
    //——会导致浅拷贝问题
	memcpy(_start, v._start, v.size() * sizeof(T));
	_finish = _start + v.size();
	_end_of_storage = _start + v.capacity();
}

vector(const vector<T>& v)//深拷贝
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	vector<T> tmp(v.begin(), v.end());
	swap(tmp);
}

 9、赋值运算符重载

//传统写法
vector<T>& operator=(const vector<T>& v)
{
	if (this != &v)
	{
		T* tmp = new T[v.capacity()];
		//memcpy(tmp, v._start, sizeof(T) * v.size());浅拷贝
		for (int i = 0; i < v.size(); i++)
			tmp[i] = v._start[i];
		delete[] _start;
		_start = tmp;
		_finish = _start + v.size();
		_end_of_storage = _start + v.capacity();
	}
	return *this;
}
//现代写法
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

三、vector迭代器失效问题(重点)

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针 T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器, 程序可能会崩溃)。

对于vector可能会导致其迭代器失效的操作有:  

  1、会引起其底层空间改变的操作,都有可能是迭代器失效。

   比如:resize、reserve、insert、assign、 push_back等。

int main()
{
	vector<int> v{ 1, 2, 3, 4, 5, 6 };
	auto it = v.begin();

	// 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
	 v.resize(100, 8);

	// reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
	 v.reserve(100);

	// 插入元素期间,可能会引起扩容,而导致原空间被释放
	 v.insert(v.begin(), 0);
	 v.push_back(8);

	// 给vector重新赋值,可能会引起底层容量改变
	v.assign(100, 8);
}

   出错原因:以上操作,都有可能会导致 vector 扩容,也就是说 vector 底层原理旧空间被释放掉,而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。
   解决方式:在以上操作完成之后,如果想要继续通过迭代器操作 vector 中的元素,只需给 it 重新赋值即可。

  2、 指定位置元素的删除操作–erase

int main()
{
	int a[] = { 1, 2, 3, 4 };
	vector<int> v(a, a + sizeof(a) / sizeof(int));

	// 使用find查找3所在位置的iterator
	vector<int>::iterator pos = find(v.begin(), v.end(), 3);

	// 删除pos位置的数据,导致pos迭代器失效。
	v.erase(pos);
	cout << *pos << endl; // 此处会导致非法访问
	return 0;
}

    erase 删除 pos 位置元素后,pos 位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果 pos 刚好是最后一个元素,删完之后 pos 刚好是 end 的位置,而 end 位置是没有元素的,那么 pos 就失效了。因此删除 vector 中任意位置上元素时,vs 就认为该位置迭代器失效了。 

   来个例子能够更好的说明一下迭代器失效的问题:

   看一下下面代码删除 vector 中所有偶数,是否正确?如果不正确,怎么改正?

int main()
{
	vector<int> v{ 1, 2, 3, 4, 5, 6 };
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
			v.erase(it);
		++it;
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

  在 VS 下,使用了 erase 函数之后,再对其解引用,是不合常理,编译器都认为迭代器是失效的。

改正后的代码:

int main()
{
	vector<int> v{ 1, 2, 3, 4, 5, 6 };
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
			//对迭代器重新赋值
			it = v.erase(it);
		else
			++it;
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	return 0;
}

运行结果:

四、使用memcpy拷贝问题

  在上面的拷贝构造函数,有两种写法:一种是浅拷贝(就是使用 memcpy 函数接口进行拷贝),另一种是深拷贝。

  浅拷贝在一般场景下是可以完成拷贝的,比如:

vector(const vector<T>& v)//浅拷贝
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	_start = new T[v.capacity()];
	//——会导致浅拷贝问题
	memcpy(_start, v._start, v.size() * sizeof(T));
	_finish = _start + v.size();
	_end_of_storage = _start + v.capacity();
}
void Test()
{
	vector<int> v1{ 1, 2, 3, 4, 5, 6 };
	vector<int> v2(v1);
	for (auto e : v2)
	{
		cout << e << " ";
	}
	cout << endl;
}

通过测试,是可以完成拷贝的。但是在下面这种场景就不能完成拷贝了。

void Test()
{
	vector<std::string> v1{ 8, "xxxxxx" };
	vector<std::string> v2(v1);
}

问题分析:

  1. memcpy 是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。
  2. 如果拷贝的是自定义类型的元素,memcpy 既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为 memcpy 的拷贝实际是浅拷贝

  此时,确实是开辟了一块新的空间,同时也将原来对象中的数据拷贝到了新的空间中,但是由于这个对象是一个 string 字符串类型,直接使用 memcpy 进行拷贝是按照字节进行了拷贝,也就是说两个对象中的 vector 中的 string 中的 _str 同时指向了一块空间,那么当 v2 在析构时,就会先将一个个字符串从内存中删除掉,当 v1 再析构时就会发生错误(同一份空间析构两次)。

  结论:如果对象中涉及到资源管理时,千万不能使用 memcpy 进行对象之间的拷贝,因为 memcpy是 浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。


本文要是有不足的地方,欢迎大家在下面评论,我会在第一时间更正。

猜你喜欢

转载自blog.csdn.net/m0_63198468/article/details/131650541
今日推荐