<C++> STL_vector

1.vector的介绍

  1. vector是表示可变大小数组的序列容器。
  2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
  3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是 一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
  4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
  5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
  6. 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list统一的迭代器和引用更好。

2.vector的使用

vector的定义方式

方式一: 构造一个某类型的空容器。

// vector()   无参构造
vector<int> v1; //构造int类型的空容器

方式二: 构造一个含有n个val的某类型容器。

//vector(size_type n, const value_type& val = value_type())
vector<int> v2(10, 2); //构造含有10个2的int类型容器

方式三: 拷贝构造某类型容器的复制品。

//vector (const vector& x)   拷贝构造
vector<int> v3(v2); //拷贝构造int类型的v2容器的复制品

方式四: 使用迭代器拷贝构造某一段内容。

//vector (InputIterator first, InputIterator last)   使用迭代器进行初始化构造
vector<int> v4(v2.begin(), v2.end()); //使用迭代器拷贝构造v2容器的某一段内容

注意:该方式也可用于拷贝其他容器的某一段内容。

string s("hello world");
vector<char> v5(s.begin(), s.end()); //拷贝构造string对象的某一段内容

vector的空间增长问题

size和capacity

通过size函数获取当前容器中的有效元素个数,通过capacity函数获取当前容器的最大容量。

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v(10, 2);
    cout << v.size() << endl;    //获取当前容器中的有效元素个数    10
    cout << v.capacity() << endl;//获取当前容器的最大容量      10
    return 0;
}

resize和reserve

通过reserve函数改变容器的最大容量,resize函数改变容器中的有效元素个数。

reserve规则:

1、当所给值大于容器当前的capacity时,将capacity扩大到该值。
 2、当所给值小于容器当前的capacity时,什么也不做。

resize规则:

1、当所给值大于容器当前的size时,将size扩大到该值,扩大的元素为第二个所给值,若未给出,则默认为0。
 2、当所给值小于容器当前的size时,将size缩小到该值。

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (int i = 0; i < 10; i++) {
    
    
        v.push_back(i);
    }
    v.resize(5);
    v.resize(8, 100);
    v.resize(12);
    // vector<int> v2(10,0);  //这也可以 ,构造开空间,不推荐,有些情况不适用
    cout << "v contains:";
    for (size_t i = 0; i < v.size(); i++) {
    
    
        cout << ' ' << v[i];// 0 1 2 3 4 100 100 100 0 0 0 0
    }
    cout << endl;

    v.resize(8);                 //修改size值
    v.reserve(8);                //小于当前容量,什么都不做
    cout << v.size() << endl;    // 8
    cout << v.capacity() << endl;// 16
    cout << v.empty() << endl;   // 0
}

vector的迭代器使用

begin和end

通过begin函数可以得到容器中第一个元素的正向迭代器,通过end函数可以得到容器中最后一个元素的后一个位置的正向迭代器。

rbegin和rend

通过rbegin函数可以得到容器中最后一个元素的反向迭代器,通过rend函数可以得到容器中第一个元素的前一个位置的反向迭代器。
在这里插入图片描述

示例:

void PrintVector(const vector<int> &v) {
    
    
    // const对象使用const迭代器进行遍历打印
    // vector<int>::iterator it = v.begin();   //err 必须const_迭代器
    vector<int>::const_iterator it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";
        it++;
    }
    cout << endl;
}

// vector的迭代器遍历
int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    for (size_t i = 0; i < v.size(); i++) {
    
    
        cout << v[i] << " ";// 1 2 3 4 5
    }
    cout << endl;

    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";// 1 2 3 4 5
        it++;
    }
    cout << endl;
    // C++11 范围for,底层是由迭代器实现的
    for (auto e: v) {
    
    
        cout << e << " ";// 1 2 3 4 5
    }
    cout << endl;

    // 使用迭代器进行修改
    it = v.begin();
    while (it != v.end()) {
    
    
        (*it) *= 2;
        it++;
    }

    for (auto e: v) {
    
    
        cout << e << " ";// 2 4 6 8 10
    }
    cout << endl;

    // 使用反向迭代器进行遍历打印
    vector<int>::reverse_iterator rit = v.rbegin();
    while (rit != v.rend()) {
    
    
        cout << *rit << " ";// 10 8 6 4 2
        rit++;
    }
    cout << endl;

    PrintVector(v);// 2 4 6 8 10
    
    return 0;
}

vector的增删查改

push_back和pop_back

void push_back(const T& value);

push_back函数将一个值 value 添加到std::vector的末尾。它会自动调整容器的大小以适应新元素。

void pop_back();

pop_back函数从std::vector的末尾删除最后一个元素。它不会返回被删除的元素,只是简单地将容器的大小减小一个单位。

int main() {
    
    
    vector<int> v;
    // vector<int> v{1,2,3,4};  //C++11支持
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.pop_back();
    auto it = v.begin();
    while (it != v.end()) {
    
    
        cout << *it << " ";// 1 2 3
        it++;
    }
    cout << endl;

    return 0;
}

insert和erase

iterator insert(iterator pos, const T& value);

insert函数将一个值 value 插入到指定迭代器 pos 所指向的位置之前。它返回一个迭代器,指向新插入的元素。插入后,其他元素会向后移动以腾出空间。

iterator erase(iterator pos);
iterator erase(iterator first, iterator last);

erase函数用于从std::vector中删除一个或一段元素。第一个版本接受一个迭代器 pos,它将删除该位置的元素,并返回指向下一个元素的迭代器。第二个版本接受两个迭代器 firstlast,它将删除这个范围内的元素,并返回指向被删除元素后面的迭代器。

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.insert(v.begin(), 0);//在容器开头插入0
    v.insert(v.begin(), 5, -1);//在容器开头插入5个-1

    v.erase(v.begin());//删除容器中的第一个元素
    v.erase(v.begin(), v.begin() + 5);//删除在该迭代器区间内的元素(左闭右开)

    return 0;
}

以上是按位置进行插入或删除元素的方式,若要按值进行插入或删除(在某一特定值位置进行插入或删除),则需要用到find函数。

find

std::find函数用于在容器中查找特定值,并返回一个迭代器指向第一个找到的匹配元素。如果未找到匹配元素,则返回容器的end()迭代器。这个函数可以用于各种STL容器

template<class InputIterator, class T>
InputIterator find (InputIterator first, InputIterator last, const T& val);

find函数在指定的范围 [first, last) 内查找值为 val 的元素。如果找到匹配元素,返回指向该元素的迭代器;如果未找到,则返回 last

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器

    v.insert(pos, 10);//在2的位置插入10

    pos = find(v.begin(), v.end(), 3);//获取值为3的元素的迭代器

    v.erase(pos);//删除3

    return 0;
}

注意: find函数是在算法模块(algorithm)当中实现的,不是vector的成员函数。

元素访问

vector当中实现了 [ ] 操作符的重载,因此我们也可以通过“下标+[ ]”的方式对容器当中的元素进行访问。

at 函数

reference at(size_type pos);
const_reference at(size_type pos) const;

at 函数用于访问指定位置的元素,并返回对该元素的引用。如果位置超出向量的范围,会抛出 std::out_of_range 异常。

data 函数

T* data() noexcept;
const T* data() const noexcept;

data 函数返回指向向量中第一个元素的指针。这使你可以直接访问向量的底层数组,但要小心在不足范围的情况下使用。

front 函数

reference front();
const_reference front() const;

front 函数返回向量的第一个元素的引用。

back 函数

reference back();
const_reference back() const;

back 函数返回向量的最后一个元素的引用。

示例:

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);

    cout << v[1] << endl;// 2
    // cout<<v[7]<<endl;  //越界不报错,打印0
    cout << v.at(1) << endl;// 2
    // cout<<v.at(7)<<endl;   // 越界报错
    cout << v.data() << endl; // 返回C格式地址,0xec1740
    cout << v.front() << endl;// 1
    cout << v.back() << endl; // 5

    return 0;
}

assign/clear/swap

template <class T>
void assign(size_type n, const T& value);

assign 函数用于为向量分配新的元素值,以替换向量中的旧内容。

void clear();

clear 函数用于清空向量中的所有元素,将其大小重置为零,但保留分配的内存空间,以便后续的元素插入可以重用该内存。

template <class T>
void swap(T& a, T& b);

std::swap函数用于交换两个变量的值。它是一个通用的函数,可以在不同类型的变量之间交换值。std::swap函数非常有用,因为它可以在不需要临时变量的情况下执行值的交换,从而提高了代码的效率。

示例:

int main() {
    
    
    vector<int> v1 = {
    
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
    vector<int> v2 = {
    
    11, 12, 13, 14, 15};
    v1.assign(v2.begin(), v2.end());
    for (auto e: v1) {
    
    
        cout << e << " ";// 11 12 13 14 15
    }
    cout << endl;

    vector<int> v3 = {
    
    1, 2, 3, 4, 5};
    v3.assign(5, 0);
    for (auto e: v3) {
    
    
        cout << e << " ";// 0 0 0 0 0
    }
    cout << endl;

    // clear清理
    v1.clear();
    for (auto e: v1) {
    
    
        cout << e << " ";// 什么都没有打印
    }
    cout << endl;
    cout << v1.capacity() << endl;// 10;
    cout << v1.size() << endl;    // 0

    // 交换v2和v3  v2为11 12 13 14 15  v3为0 0 0 0 0
    v2.swap(v3);
    for (auto e: v3) {
    
    
        cout << e << " ";// 11 12 13 14 15
    }
    cout << endl;

    return 0;
}

3.vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了 封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的 空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器, 程序可能会崩溃)。

迭代器失效问题举例

实例一:

#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    //v: 1 2 3 4 5
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
    v.insert(pos, 10);                                      //在值为2的元素的位置插入10
    //v: 1 10 2 3 4 5
    v.erase(pos);//删除元素2 ???error(迭代器失效)
    //v: 1 2 3 4 5
    return 0;
}

在该代码中,我们本意是使用元素2的迭代器在原序列中2的位置插入一个10,然后将2删除,但我们实际上获取的是指向2的指针,当我们在2的位置插入10后,该指针就指向了10,所以我们之后删除的实际上是10,而不是2。

实例二:

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (size_t i = 1; i <= 6; i++) {
    
    
        v.push_back(i);
    }
    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        if (*it % 2 == 0)//删除容器当中的全部偶数
        {
    
    
            v.erase(it);
        }
        it++;
    }
    return 0;
}

该代码看上去实际上并没有什么错误,但如果你画图仔细分析,你就会发现该代码的问题所在,迭代器访问到了不属于容器的内存空间,导致程序崩溃。

在这里插入图片描述

不仅如此,而且在迭代器遍历容器中的元素进行判断时,并没有对1、3、5元素进行判断。

迭代器失效解决方法

使用迭代器时,永远记住一句话:每次使用前,对迭代器进行重新赋值。

实例一解决方案:

#include <algorithm>
#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    //v: 1 2 3 4 5
    vector<int>::iterator pos = find(v.begin(), v.end(), 2);//获取值为2的元素的迭代器
    v.insert(pos, 10);                                      //在值为2的元素的位置插入10
    //v: 1 10 2 3 4 5
    pos = find(v.begin(), v.end(), 2);//重新获取值为2的元素的迭代器
    v.erase(pos);                     //删除元素2
    //v: 1 10 3 4 5
    return 0;
}

实例二解决方案:

#include <iostream>
#include <vector>
using namespace std;

int main() {
    
    
    vector<int> v;
    for (size_t i = 1; i <= 6; i++) {
    
    
        v.push_back(i);
    }
    vector<int>::iterator it = v.begin();
    while (it != v.end()) {
    
    
        if (*it % 2 == 0)//删除容器当中的全部偶数
        {
    
    
            it = v.erase(it);//删除后获取下一个元素的迭代器
        } else {
    
    
            it++;//是奇数则it++
        }
    }
    return 0;
}

对于实例二,我们可以接收erase函数的返回值(erase函数返回删除元素的后一个元素的新位置),并且控制代码的逻辑:当元素被删除后继续判断该位置的元素(因为该位置的元素已经更新,需要再次判断)。

4.vector模拟实现

在这里插入图片描述

在这里插入图片描述

vector的核心框架接口的模拟实现

#pragma once
#include <algorithm>
#include <cassert>
#include <functional>
#include <iostream>
#include <string.h>
#include <string>
using namespace std;

template<class T>
class vector {
    
    
public:
    typedef T *iterator;
    typedef const T *const_iterator;
    vector()
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
    }

    vector(size_t n, const T &val = T())
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
        reserve(n);
        for (size_t i = 0; i < n; i++) {
    
    
            push_back(val);
        }
    }
    // 重载构造函数
    vector(int n, const T &val = T())
        : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {
    
    
        reserve(n);
        for (int i = 0; i < n; i++) {
    
    
            push_back(val);
        }
    }

    // 迭代器构造函数
    template<class InputIterator>
    vector(InputIterator first, InputIterator last) {
    
    
        while (first != last) {
    
    
            push_back(*first);
            first++;
        }
    }

    vector(const vector<T> &v) {
    
    
        _start = new T[v.capacity()];
        // memcpy(_start, v._start, sizeof(T) * v.size());
        // memcpy会还会导致深拷贝里的深拷贝问题。
        // 对于自定义类型,自定义类型里的内存,会被复制,那么拷贝构造的会指向同一块空间,会因调用析构函数出现报错。
        // 在进行深拷贝时,应该确保源vector的元素数量小于或等于目标vector的容量,否则会发生缓冲区溢出。
        if (v.size() <= capacity())// 确保源向量的大小小于或等于目标向量的容量
        {
    
    
            for (size_t i = 0; i < v.size(); i++) {
    
    
                // new (_start + i) T(v._start[i]);
                //  调用拷贝构造函数进行深拷贝
                _start[i] = v._start[i];
                // 进行_start[i]赋值。赋值对于自定义类型,会额外开空间,进行深拷贝。这样就解决了深拷贝里的深拷贝
            }
            _finish = _start + v.size();
        } else// 如果源向量的大小大于目标向量的容量,只拷贝目标向量能容纳的部分
        {
    
    
            for (size_t i = 0; i < capacity(); i++) {
    
    
                _start[i] = v._start[i];
            }
            _finish = _start + capacity();
        }
        _end_of_storage = _start + v.capacity();
    }

    iterator begin() {
    
    
        return _start;
    }

    iterator end() {
    
    
        return _finish;
    }

    // 这里必须加上const,两个begin函数,只是参数返回类型不同
    // 编译器无法根据函数返回类型来区分函数,
    // 因为函数重载不允许仅仅因为返回类型不同而进行区分。这将导致编译错误。
    // 加入const修饰符,以便编译器可以正确地区分这两个函数
    const_iterator begin() const {
    
    
        return _start;
    }

    const_iterator end() const {
    
    
        return _finish;
    }

    void reserve(size_t n) {
    
    
        int sz = size();
        // n>capacity才需要扩容,否则n<capacity可能会缩容
        if (n > capacity()) {
    
    
            T *tmp = new T[n];
            // 将_start的内存,拷贝到tmp中
            if (_start) {
    
    
                // memcpy是一种浅拷贝函数,这里会引起内存问题 ,因为后面_start要释放,调用析构函数
                // memcpy(tmp, _start, sizeof(T*) * size());
                for (size_t i = 0; i < size(); i++) {
    
    
                    // 手动深拷贝
                    tmp[i] = _start[i];
                }
                delete[] _start;
            }
            _start = tmp;
            _finish = _start + sz;
            // 这里_start内存发生了变化,所以_finish需要重新初始化,加上原来的sz即可
            // 不可以加上现在的size(),因为_start发生了变化,size()得不到想要的结果
            _end_of_storage = _start + n;
        }
    }

    void resize(size_t n, T val = T())// //T()默认构造,匿名对象,对于自定义类型,和内置类型比如int都会初始化
    {
    
    
        if (n < size()) {
    
    
            // 缩容
            _finish = _start + n;
        } else {
    
    
            if (n > capacity()) {
    
    
                reserve(n);
            }
            while (_finish != _start + n) {
    
    
                *_finish = val;
                _finish++;
            }
        }
    }

    void push_back(const T &x) {
    
    
        if (_finish == _end_of_storage) {
    
    
            // 扩容  一种是一开始都为NULL,另一种是需要扩容
            reserve(capacity() == 0 ? 4 : capacity() * 2);
        }

        *_finish = x;// 可能发生空指针解引用
        _finish++;
    }

    void pop_back() {
    
    
        if (!empty())
            _finish--;
    }

    void insert(iterator pos, const T &val = T()) {
    
    
        assert(pos >= _start);
        assert(pos <= _finish);
        if (_finish == _end_of_storage) {
    
    
            // 迭代器失效问题!
            // reserve扩容,会释放掉旧空间,那么pos位置也会被释放,需要更新pos,解决pos失效的问题
            // 那么pos的位置怎么算呢,相对位置! 算出pos之前的相对_start的相对位置
            int len = pos - _start;
            reserve(capacity() == 0 ? 4 : capacity() * 2);
            // 更新pos
            pos = _start + len;
        }

        iterator end = _finish - 1;
        while (end >= pos) {
    
    
            *(end + 1) = *end;
            end--;
        }
        *pos = val;
        _finish++;
    }

    // erase后迭代器需要更新,因为迭代器指向的在删除后,会改变指向
    iterator erase(iterator pos) {
    
    
        assert(pos >= _start);
        assert(pos < _finish);
        iterator start = pos + 1;
        while (start != _finish) {
    
    
            *(start - 1) = *(start);
            ++start;
        }
        _finish--;

        // 返回pos的下一个地址,pos的下一个地址的值被赋值给上一个,所以还是返回pos。
        return pos;
    }

    bool empty() const {
    
    
        return _start == _finish;
    }

    size_t capacity() const {
    
    
        return _end_of_storage - _start;
    }

    size_t size() const {
    
    
        return _finish - _start;
    }

    T &operator[](size_t pos) {
    
    
        return _start[pos];
    }

    const T &operator[](size_t pos) const {
    
    
        return _start[pos];
    }

    ~vector() {
    
    
        delete[] _start;
        _start = nullptr;
        _finish = nullptr;
        _end_of_storage = nullptr;
    }

private:
    // vector的成员变量为3个迭代器
    iterator _start = nullptr;
    iterator _finish = nullptr;
    iterator _end_of_storage = nullptr;
    //_start 为开始下标0
    //_finish 为数值的下一个位置
    //_end_of_storage 为容量
};

使用memcpy拷贝问题

假设模拟实现的vector中的reserve接口中,使用memcpy进行的拷贝,以下代码会发生什么问题?

int main() {
    
    
    vector<string> v;
    v.push_back("1111");
    v.push_back("2222");
    v.push_back("3333");
    return 0;
}

问题分析:

  1. memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中
  2. 如果拷贝的是内置类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。

在这里插入图片描述

结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。

动态二维数组理解

#include <vector>
using namespace std;
// 以杨慧三角的前n行为例:假设n为5
void test2vector(size_t n) {
    
    
    vector<vector<int>> vv(n);
    for (size_t i = 0; i < n; ++i)
        vv[i].resize(i + 1, 1);
    // 给杨慧三角出第一列和对角线的所有元素赋值
    for (int i = 2; i < n; ++i) {
    
    
        for (int j = 1; j < i; ++j) {
    
    
            vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
        }
    }
}

构造一个vv动态二维数组,vv中总共有n个元素,每个元素都是vector类 型的,每行没有包含任何元素,如果n为5时如下所示:
在这里插入图片描述
vv中元素填充完成之后,如下图所示:

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/ikun66666/article/details/132517569