1.vector的介绍

vector是表示可变大小数组的序列容器。

就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。

vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。

与其它动态序列容器相比（deque, list and forward_list）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起list和forward_list统一的迭代器和引用更好。

2.vector的使用

vector的定义方式

方式一： 构造一个某类型的空容器。

// vector()   无参构造
vector<int> v1; //构造int类型的空容器

方式二： 构造一个含有n个val的某类型容器。

//vector（size_type n, const value_type& val = value_type())
vector<int> v2(10, 2); //构造含有10个2的int类型容器

方式三： 拷贝构造某类型容器的复制品。

//vector (const vector& x)   拷贝构造
vector<int> v3(v2); //拷贝构造int类型的v2容器的复制品

方式四： 使用迭代器拷贝构造某一段内容。

//vector (InputIterator first, InputIterator last)   使用迭代器进行初始化构造
vector<int> v4(v2.begin(), v2.end()); //使用迭代器拷贝构造v2容器的某一段内容

注意：该方式也可用于拷贝其他容器的某一段内容。

string s("hello world");
vector<char> v5(s.begin(), s.end()); //拷贝构造string对象的某一段内容

vector的空间增长问题

size和capacity

通过size函数获取当前容器中的有效元素个数，通过capacity函数获取当前容器的最大容量。

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v(10, 2);
    cout << v.size() << endl;    //获取当前容器中的有效元素个数    10
    cout << v.capacity() << endl;//获取当前容器的最大容量      10
    return 0;
}

resize和reserve

通过reserve函数改变容器的最大容量，resize函数改变容器中的有效元素个数。

reserve规则：

1、当所给值大于容器当前的capacity时，将capacity扩大到该值。
2、当所给值小于容器当前的capacity时，什么也不做。

resize规则：

1、当所给值大于容器当前的size时，将size扩大到该值，扩大的元素为第二个所给值，若未给出，则默认为0。
2、当所给值小于容器当前的size时，将size缩小到该值。

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (int i = 0; i < 10; i++) {
    
    
        v.push_back(i);
    }
    v.resize(5);
    v.resize(8, 100);
    v.resize(12);
    // vector<int> v2(10,0);  //这也可以 ，构造开空间，不推荐，有些情况不适用
    cout << "v contains:";
    for (size_t i = 0; i < v.size(); i++) {
    
    
        cout << ' ' << v[i];// 0 1 2 3 4 100 100 100 0 0 0 0
    }
    cout << endl;

    v.resize(8);                 //修改size值
    v.reserve(8);                //小于当前容量，什么都不做
    cout << v.size() << endl;    // 8
    cout << v.capacity() << endl;// 16
    cout << v.empty() << endl;   // 0
}

vector的迭代器使用

begin和end

通过begin函数可以得到容器中第一个元素的正向迭代器，通过end函数可以得到容器中最后一个元素的后一个位置的正向迭代器。

rbegin和rend

通过rbegin函数可以得到容器中最后一个元素的反向迭代器，通过rend函数可以得到容器中第一个元素的前一个位置的反向迭代器。
在这里插入图片描述

示例：

void PrintVector(const vector<int> &v) {
    
    
    // const对象使用const迭代器进行遍历打印
    // vector<int>::iterator it = v.begin();   //err 必须const_迭代器
    vector<int>::const_iterator it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";
        it++;
    }
    cout << endl;
}

// vector的迭代器遍历
int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    for (size_t i = 0; i < v.size(); i++) {
    
    
        cout << v[i] << " ";// 1 2 3 4 5
    }
    cout << endl;

    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";// 1 2 3 4 5
        it++;
    }
    cout << endl;
    // C++11 范围for，底层是由迭代器实现的
    for (auto e: v) {
    
    
        cout << e << " ";// 1 2 3 4 5
    }
    cout << endl;

    // 使用迭代器进行修改
    it = v.begin();
    while (it != v.end()) {
    
    
        (*it) *= 2;
        it++;
    }

    for (auto e: v) {
    
    
        cout << e << " ";// 2 4 6 8 10
    }
    cout << endl;

    // 使用反向迭代器进行遍历打印
    vector<int>::reverse_iterator rit = v.rbegin();
    while (rit != v.rend()) {
    
    
        cout << *rit << " ";// 10 8 6 4 2
        rit++;
    }
    cout << endl;

    PrintVector(v);// 2 4 6 8 10
    
    return 0;
}

vector的增删查改

push_back和pop_back

void push_back(const T& value);

push_back函数将一个值 value 添加到std::vector的末尾。它会自动调整容器的大小以适应新元素。

void pop_back();

pop_back函数从std::vector的末尾删除最后一个元素。它不会返回被删除的元素，只是简单地将容器的大小减小一个单位。

int main() {
    
    
    vector<int> v;
    // vector<int> v{1,2,3,4};  //C++11支持
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.pop_back();
    auto it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";// 1 2 3
        it++;
    }
    cout << endl;

    return 0;
}

insert和erase

iterator insert(iterator pos, const T& value);

insert函数将一个值 value 插入到指定迭代器 pos 所指向的位置之前。它返回一个迭代器，指向新插入的元素。插入后，其他元素会向后移动以腾出空间。

iterator erase(iterator pos);
iterator erase(iterator first, iterator last);

erase函数用于从std::vector中删除一个或一段元素。第一个版本接受一个迭代器 pos，它将删除该位置的元素，并返回指向下一个元素的迭代器。第二个版本接受两个迭代器 first 和 last，它将删除这个范围内的元素，并返回指向被删除元素后面的迭代器。

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.insert(v.begin(), 0);//在容器开头插入0
    v.insert(v.begin(), 5, -1);//在容器开头插入5个-1

    v.erase(v.begin());//删除容器中的第一个元素
    v.erase(v.begin(), v.begin() + 5);//删除在该迭代器区间内的元素（左闭右开）

    return 0;
}

以上是按位置进行插入或删除元素的方式，若要按值进行插入或删除（在某一特定值位置进行插入或删除），则需要用到find函数。

find

std::find函数用于在容器中查找特定值，并返回一个迭代器指向第一个找到的匹配元素。如果未找到匹配元素，则返回容器的end()迭代器。这个函数可以用于各种STL容器

template<class InputIterator, class T>
InputIterator find (InputIterator first, InputIterator last, const T& val);

find函数在指定的范围 [first, last) 内查找值为 val 的元素。如果找到匹配元素，返回指向该元素的迭代器；如果未找到，则返回 last。

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器

    v.insert(pos, 10);//在2的位置插入10

    pos = find(v.begin(), v.end(), 3);//获取值为3的元素的迭代器

    v.erase(pos);//删除3

    return 0;
}

注意： find函数是在算法模块（algorithm）当中实现的，不是vector的成员函数。

元素访问

vector当中实现了 [ ] 操作符的重载，因此我们也可以通过“下标+[ ]”的方式对容器当中的元素进行访问。

at 函数：

reference at(size_type pos);
const_reference at(size_type pos) const;

at 函数用于访问指定位置的元素，并返回对该元素的引用。如果位置超出向量的范围，会抛出 std::out_of_range 异常。

data 函数：

T* data() noexcept;
const T* data() const noexcept;

data 函数返回指向向量中第一个元素的指针。这使你可以直接访问向量的底层数组，但要小心在不足范围的情况下使用。

front 函数：

reference front();
const_reference front() const;

front 函数返回向量的第一个元素的引用。

back 函数：

reference back();
const_reference back() const;

back 函数返回向量的最后一个元素的引用。

示例：

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);

    cout << v[1] << endl;// 2
    // cout<<v[7]<<endl;  //越界不报错,打印0
    cout << v.at(1) << endl;// 2
    // cout<<v.at(7)<<endl;   // 越界报错
    cout << v.data() << endl; // 返回C格式地址，0xec1740
    cout << v.front() << endl;// 1
    cout << v.back() << endl; // 5

    return 0;
}

assign/clear/swap

template <class T>
void assign(size_type n, const T& value);

assign 函数用于为向量分配新的元素值，以替换向量中的旧内容。

void clear();

clear 函数用于清空向量中的所有元素，将其大小重置为零，但保留分配的内存空间，以便后续的元素插入可以重用该内存。

template <class T>
void swap(T& a, T& b);

std::swap函数用于交换两个变量的值。它是一个通用的函数，可以在不同类型的变量之间交换值。std::swap函数非常有用，因为它可以在不需要临时变量的情况下执行值的交换，从而提高了代码的效率。

示例：

int main() {
    
    
    vector<int> v1 = {
    
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
    vector<int> v2 = {
    
    11, 12, 13, 14, 15};
    v1.assign(v2.begin(), v2.end());
    for (auto e: v1) {
    
    
        cout << e << " ";// 11 12 13 14 15
    }
    cout << endl;

    vector<int> v3 = {
    
    1, 2, 3, 4, 5};
    v3.assign(5, 0);
    for (auto e: v3) {
    
    
        cout << e << " ";// 0 0 0 0 0
    }
    cout << endl;

    // clear清理
    v1.clear();
    for (auto e: v1) {
    
    
        cout << e << " ";// 什么都没有打印
    }
    cout << endl;
    cout << v1.capacity() << endl;// 10;
    cout << v1.size() << endl;    // 0

    // 交换v2和v3  v2为11 12 13 14 15  v3为0 0 0 0 0
    v2.swap(v3);
    for (auto e: v3) {
    
    
        cout << e << " ";// 11 12 13 14 15
    }
    cout << endl;

    return 0;
}

3.vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

迭代器失效问题举例

实例一：

#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    //v: 1 2 3 4 5
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
    v.insert(pos, 10);                                      //在值为2的元素的位置插入10
    //v: 1 10 2 3 4 5
    v.erase(pos);//删除元素2 ？？？error（迭代器失效）
    //v: 1 2 3 4 5
    return 0;
}

在该代码中，我们本意是使用元素2的迭代器在原序列中2的位置插入一个10，然后将2删除，但我们实际上获取的是指向2的指针，当我们在2的位置插入10后，该指针就指向了10，所以我们之后删除的实际上是10，而不是2。

实例二：

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (size_t i = 1; i <= 6; i++) {
    
    
        v.push_back(i);
    }
    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        if (*it % 2 == 0)//删除容器当中的全部偶数
        {
    
    
            v.erase(it);
        }
        it++;
    }
    return 0;
}

该代码看上去实际上并没有什么错误，但如果你画图仔细分析，你就会发现该代码的问题所在，迭代器访问到了不属于容器的内存空间，导致程序崩溃。

在这里插入图片描述

不仅如此，而且在迭代器遍历容器中的元素进行判断时，并没有对1、3、5元素进行判断。

迭代器失效解决方法

使用迭代器时，永远记住一句话：每次使用前，对迭代器进行重新赋值。

实例一解决方案：

#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    //v: 1 2 3 4 5
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
    v.insert(pos, 10);                                      //在值为2的元素的位置插入10
    //v: 1 10 2 3 4 5
    pos = find(v.begin(), v.end(), 2);//重新获取值为2的元素的迭代器
    v.erase(pos);                     //删除元素2
    //v: 1 10 3 4 5
    return 0;
}

实例二解决方案：

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (size_t i = 1; i <= 6; i++) {
    
    
        v.push_back(i);
    }
    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        if (*it % 2 == 0)//删除容器当中的全部偶数
        {
    
    
            it = v.erase(it);//删除后获取下一个元素的迭代器
        } else {
    
    
            it++;//是奇数则it++
        }
    }
    return 0;
}

对于实例二，我们可以接收erase函数的返回值（erase函数返回删除元素的后一个元素的新位置），并且控制代码的逻辑：当元素被删除后继续判断该位置的元素（因为该位置的元素已经更新，需要再次判断）。

4.vector模拟实现

在这里插入图片描述

vector的核心框架接口的模拟实现

#pragma once
#include <algorithm>
#include <cassert>
#include <functional>
#include <iostream>
#include <string.h>
#include <string>
using namespace std;

template<class T>
class vector {
    
    
public:
    typedef T *iterator;
    typedef const T *const_iterator;
    vector()
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
    }

    vector(size_t n, const T &val = T())
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
        reserve(n);
        for (size_t i = 0; i < n; i++) {
    
    
            push_back(val);
        }
    }
    // 重载构造函数
    vector(int n, const T &val = T())
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
        reserve(n);
        for (int i = 0; i < n; i++) {
    
    
            push_back(val);
        }
    }

    // 迭代器构造函数
    template<class InputIterator>
    vector(InputIterator first, InputIterator last) {
    
    
        while (first != last) {
    
    
            push_back(*first);
            first++;
        }
    }

    vector(const vector<T> &v) {
    
    
        _start = new T[v.capacity()];
        // memcpy(_start, v._start, sizeof(T) * v.size());
        // memcpy会还会导致深拷贝里的深拷贝问题。
        // 对于自定义类型，自定义类型里的内存，会被复制，那么拷贝构造的会指向同一块空间，会因调用析构函数出现报错。
        // 在进行深拷贝时，应该确保源vector的元素数量小于或等于目标vector的容量，否则会发生缓冲区溢出。
        if (v.size() <= capacity())// 确保源向量的大小小于或等于目标向量的容量
        {
    
    
            for (size_t i = 0; i < v.size(); i++) {
    
    
                // new (_start + i) T(v._start[i]);
                //  调用拷贝构造函数进行深拷贝
                _start[i] = v._start[i];
                // 进行_start[i]赋值。赋值对于自定义类型，会额外开空间，进行深拷贝。这样就解决了深拷贝里的深拷贝
            }
            _finish = _start + v.size();
        } else// 如果源向量的大小大于目标向量的容量，只拷贝目标向量能容纳的部分
        {
    
    
            for (size_t i = 0; i < capacity(); i++) {
    
    
                _start[i] = v._start[i];
            }
            _finish = _start + capacity();
        }
        _end_of_storage = _start + v.capacity();
    }

    iterator begin() {
    
    
        return _start;
    }

    iterator end() {
    
    
        return _finish;
    }

    // 这里必须加上const，两个begin函数，只是参数返回类型不同
    // 编译器无法根据函数返回类型来区分函数，
    // 因为函数重载不允许仅仅因为返回类型不同而进行区分。这将导致编译错误。
    // 加入const修饰符，以便编译器可以正确地区分这两个函数
    const_iterator begin() const {
    
    
        return _start;
    }

    const_iterator end() const {
    
    
        return _finish;
    }

    void reserve(size_t n) {
    
    
        int sz = size();
        // n>capacity才需要扩容，否则n<capacity可能会缩容
        if (n > capacity()) {
    
    
            T *tmp = new T[n];
            // 将_start的内存，拷贝到tmp中
            if (_start) {
    
    
                // memcpy是一种浅拷贝函数，这里会引起内存问题 ，因为后面_start要释放，调用析构函数
                // memcpy(tmp, _start, sizeof(T*) * size());
                for (size_t i = 0; i < size(); i++) {
    
    
                    // 手动深拷贝
                    tmp[i] = _start[i];
                }
                delete[] _start;
            }
            _start = tmp;
            _finish = _start + sz;
            // 这里_start内存发生了变化，所以_finish需要重新初始化，加上原来的sz即可
            // 不可以加上现在的size()，因为_start发生了变化，size()得不到想要的结果
            _end_of_storage = _start + n;
        }
    }

    void resize(size_t n, T val = T())// //T()默认构造，匿名对象，对于自定义类型，和内置类型比如int都会初始化
    {
    
    
        if (n < size()) {
    
    
            // 缩容
            _finish = _start + n;
        } else {
    
    
            if (n > capacity()) {
    
    
                reserve(n);
            }
            while (_finish != _start + n) {
    
    
                *_finish = val;
                _finish++;
            }
        }
    }

    void push_back(const T &x) {
    
    
        if (_finish == _end_of_storage) {
    
    
            // 扩容  一种是一开始都为NULL，另一种是需要扩容
            reserve(capacity() == 0 ? 4 : capacity() * 2);
        }

        *_finish = x;// 可能发生空指针解引用
        _finish++;
    }

    void pop_back() {
    
    
        if (!empty())
            _finish--;
    }

    void insert(iterator pos, const T &val = T()) {
    
    
        assert(pos >= _start);
        assert(pos <= _finish);
        if (_finish == _end_of_storage) {
    
    
            // 迭代器失效问题!
            // reserve扩容，会释放掉旧空间，那么pos位置也会被释放，需要更新pos，解决pos失效的问题
            // 那么pos的位置怎么算呢，相对位置！ 算出pos之前的相对_start的相对位置
            int len = pos - _start;
            reserve(capacity() == 0 ? 4 : capacity() * 2);
            // 更新pos
            pos = _start + len;
        }

        iterator end = _finish - 1;
        while (end >= pos) {
    
    
            *(end + 1) = *end;
            end--;
        }
        *pos = val;
        _finish++;
    }

    // erase后迭代器需要更新，因为迭代器指向的在删除后，会改变指向
    iterator erase(iterator pos) {
    
    
        assert(pos >= _start);
        assert(pos < _finish);
        iterator start = pos + 1;
        while (start != _finish) {
    
    
            *(start - 1) = *(start);
            ++start;
        }
        _finish--;

        // 返回pos的下一个地址，pos的下一个地址的值被赋值给上一个，所以还是返回pos。
        return pos;
    }

    bool empty() const {
    
    
        return _start == _finish;
    }

    size_t capacity() const {
    
    
        return _end_of_storage - _start;
    }

    size_t size() const {
    
    
        return _finish - _start;
    }

    T &operator[](size_t pos) {
    
    
        return _start[pos];
    }

    const T &operator[](size_t pos) const {
    
    
        return _start[pos];
    }

    ~vector() {
    
    
        delete[] _start;
        _start = nullptr;
        _finish = nullptr;
        _end_of_storage = nullptr;
    }

private:
    // vector的成员变量为3个迭代器
    iterator _start = nullptr;
    iterator _finish = nullptr;
    iterator _end_of_storage = nullptr;
    //_start 为开始下标0
    //_finish 为数值的下一个位置
    //_end_of_storage 为容量
};

使用memcpy拷贝问题

假设模拟实现的vector中的reserve接口中，使用memcpy进行的拷贝，以下代码会发生什么问题？

int main() {
    
    
    vector<string> v;
    v.push_back("1111");
    v.push_back("2222");
    v.push_back("3333");
    return 0;
}

问题分析：

memcpy是内存的二进制格式拷贝，将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
如果拷贝的是内置类型的元素，memcpy既高效又不会出错，但如果拷贝的是自定义类型元素，并且自定义类型元素中涉及到资源管理时，就会出错，因为memcpy的拷贝实际是浅拷贝。

在这里插入图片描述

结论：如果对象中涉及到资源管理时，千万不能使用memcpy进行对象之间的拷贝，因为memcpy是浅拷贝，否则可能会引起内存泄漏甚至程序崩溃。

动态二维数组理解

#include <vector>
using namespace std;
// 以杨慧三角的前n行为例：假设n为5
void test2vector(size_t n) {
    
    
    vector<vector<int>> vv(n);
    for (size_t i = 0; i < n; ++i)
        vv[i].resize(i + 1, 1);
    // 给杨慧三角出第一列和对角线的所有元素赋值
    for (int i = 2; i < n; ++i) {
    
    
        for (int j = 1; j < i; ++j) {
    
    
            vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
        }
    }
}

构造一个vv动态二维数组，vv中总共有n个元素，每个元素都是vector类型的，每行没有包含任何元素，如果n为5时如下所示：
在这里插入图片描述
vv中元素填充完成之后，如下图所示：

在这里插入图片描述

＜C++＞ STL_vector

1.vector的介绍

2.vector的使用

vector的定义方式

vector的空间增长问题

size和capacity

resize和reserve

vector的迭代器使用

vector的增删查改

push_back和pop_back

insert和erase

find

元素访问

assign/clear/swap

3.vector迭代器失效问题

迭代器失效问题举例

迭代器失效解决方法

4.vector模拟实现

vector的核心框架接口的模拟实现

使用memcpy拷贝问题

动态二维数组理解

猜你喜欢