C++初阶 — vector

目录

一、vector的介绍及使用

  1. vector的介绍

 2. vector的使用

   2.1 vector的定义

   2.2 vector iterator 的使用 

   2.3 vector 空间增长问题 

   2.3 vector 增删查改

二、vector(简易)的模拟实现以及会出现的问题

  1. vector的核心框架

  2. 构造函数,push_back和reserve

  3.迭代器和下标访问[ ]

4. pop_back和empty

   5. resize

   6. insert

   7. erase

   8. swap 和析构函数

  9. 构造函数多种使用场景

  10. 拷贝构造和赋值重载


一、vector的介绍及使用

  1. vector的介绍

1. vector是表示可变大小数组的序列容器。

2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素 进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自 动处理。

3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小 为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是 一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大 小。

4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存 储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是 对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增 长。

6. 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末 尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list 统一的迭代器和引用更好。

 2. vector的使用

vector学习时一定要学会查看文档:vector的文档介绍,vector在实际中非常的重要,在实际中我们熟悉常 见的接口就可以,下面列出了哪些接口是要重点掌握的。

   2.1 vector的定义

   2.2 vector iterator 的使用 

   2.3 vector 空间增长问题 

   2.3 vector 增删查改


二、vector(简易)的模拟实现以及会出现的问题

  1. vector的核心框架

        这是根据STL 源码经过筛减后得到的核心框架,是不是和string很像。

template<class T>
    class vector {
    public:
        typedef T* iterator;
        typedef const T* const_iterator;

        //成员函数

    private:
        iterator _start;
        iterator _finish;
        iterator _end_of_storage;
    };
}

 vector的底层和string的底层非常相似,都是指针指向一个动态开辟的数组,只不过string的成员是用size和capacity标识容量,而vector的成员是用finish指向size的位置,end_of_storage指向capacity的位置,虽然vector看起来更复杂一些,但本质上是一样的,string用的是下标,vector用的是指针。

  2. 构造函数,push_back和reserve

        还是根据需求写成员函数,有了string的基础写vector还是比较轻松的。(可以参考一下)

(11条消息) C++初阶 — string_晚风不及你的笑427的博客-CSDN博客

        无参的构造函数只需要用初始化列表将三个成员指针初始化为空即可。为了方便后续的使用,先把size和capacity实现出来,这两个用指针减指针就可以得到。而后是就插入数据,插入数据跟string一样,判断是否扩容,然后插入数据。正好用到reserve,就把reserve写了,这里reserve稍微有点复杂,因为它涉及到对自定义类型浅拷贝的问题。这里的扩容是重新开空间,有数据就把数据拷贝过去,如果是内置类型,那么memcpy可以正常使用。如果我们是自定义类型,比如vector<vector<int>>,只会让tmp里的指针指向start指向的空间,一旦释放start指向的空间,那么tmp里的指针就成野指针了。但是下面的写法还需要赋值重载函数实现了以后才能使用,所以暂时先用memcpy把一些很简单的成员函数写了,后面在考虑这个问题。

//构造函数
		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endOfStorage(nullptr)
		{}
//容量
		size_t size()const
		{
			return _finish - _start;
		}
		size_t capacity()const
		{
			return _endOfStorage - _start;
		}
//插入数据
		void push_back(const T& x)
		{
            //判断是否扩容
			if (_finish == _endOfStorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
			}
			*_finish = x;
			++_finish;
		}
//改变容量,只扩容,不缩容
	void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t oldsize = size();//记录原来的size,避免释放掉空间以后,finish出问题
				iterator tmp = new T[n];

				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * size());这种写法会发生浅拷贝问题
					for (size_t i = 0; i < oldsize; ++i)
					{
						tmp[i] = _start[i];
					}
				}

				delete[] _start;
				_start = tmp;
				_finish = _start + oldsize;
				_endOfStorage = _start + n;
			}
		}

  3.迭代器和下标访问[ ]

        迭代器这里参考string的实现方法,begin就是数组元素的第一个位置,end就是数组元素的下一个位置。同时实现了const版本,便于后续的使用。下标访问这里和库里的一致,加一个断言,让pos必须在有效数值区间,同时重载一个只读的版本,有const类型的对象可以直接调用。

//迭代器
        iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin()const
		{
			return _start;
		}
		const_iterator end()const
		{
			return _finish;
		}
//下标访问
        T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}
		const T& operator[](size_t pos)const
		{
			assert(pos < size());
			return _start[pos];
		}

4. pop_back和empty

        只要finish == start就认为数组是空的,从尾部删除数据也很简单,finish指针前移一位即可。

//删除数据
        void pop_back()
		{
			assert(!empty());
			--_finish;
		}
//判断数组是否为空
        bool empty()const
		{
			return _finish == _start;
		}

操作演示:

   5. resize

        这里resize和string的resize很相似,也是三种情况,1. size < n < capacity,填充数据到到n的位置;2. capacity < n ,扩容并且填充数据,3. n < size ,删除数据剩n个。

//改变vector的size,如果不传参数会用匿名对象填充
        void resize(size_t n, const T& value = T())
		{
			if (n > capacity())
			{
				reserve(n);
			}
			if (n > size())
			{
				while (_finish < _start + n)
				{
					*_finish = value;
					++_finish;
				}
			}
			else if (n < size())
			{
				_finish = _start + n;
			}
		}

操作演示:

   6. insert

        这里需要注意pos的位置要合法,也就是说pos位置要在有效数值区间,加个断言防止出现问题。插入数据有可能会导致空间存满,就会出现扩容需求。扩容这里需要特别注意,会出现迭代器失效问题,因为自己写的扩容是异地扩容,也就是说原本的空间会释放掉,再找块新空间给start,这时pos还指向原来的空间,那么到挪动数据的时候,while循环里的判断条件会出现问题,不是你想要的结果。所以在发生扩容的时候,即使的对pos也进行更新,这样就不会出现迭代器失效的问题了。还有就是这里为什么会 return pos,因为是传值传参,修改内部的pos,并不会对外部的pos进行修改,所以发生扩容的时候内部的pos被修改了,但外部的pos并没有被修改,如果直接在外部解引用访问pos,会发生野指针问题。上述问题只有扩容才会发生。

//pos位置插入数据
        iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start && pos < _finish);
			if (_finish == _endOfStorage)
			{
				size_t len = pos - _start;
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
				// 扩容会导致pos迭代器失效,需要更新处理一下
				pos = _start + len;
			}
			//挪动数据
			iterator end = _finish - 1;
			while (pos <= end)
			{
				*(end + 1) = *end;
				--end;
			}
			*pos = x;
			++_finish;
			return pos;
		}

 操作演示:

   7. erase

        依旧是先保证pos位置在有效数值区间,删除数据就是把pos后面的数据覆盖上来,那么pos位置的数据就没有了,删除完成,返回删除之后pos的位置,避免因为边界问题引发对pos指针解引用后出现野指针问题。

//删除pos位置数据
		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert( pos < _finish);
			//挪动数据
			iterator begin = pos + 1;
			while (begin < _finish)
			{
				*(begin - 1) = *begin;
				++begin;
			}
			--_finish;
			return pos;
		}

 操作演示:

   8. swap 和析构函数

        这两个函数比较简单,swap在string里有讲,这里就不过多赘述了,用的是现代写法。

析构函数是释放空间,三个指针赋空。

//交换函数
		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endOfStorage, v._endOfStorage);
		}
//析构函数
        ~vector()
		{
			delete[] _start;
			_start = _finish = _endOfStorage = nullptr;
		}

  9. 构造函数多种使用场景

        这里我就直接复用其他函数,这里多写了一个int版本,避免用int类型初始化时,编译器去调用模板。可能会有人问为什么编译器会调用模板初始化?因为两个都是int类型贴合模板,用size_t还要隐式类型转换。

//v(10,1)
		vector(int n, const T& value = T())
			:_start(nullptr)
			, _finish(nullptr)
			, _endOfStorage(nullptr)
		{
			reserve(n);
			for (int i = 0;i < n;++i)
			{
				push_back(value);
			}
		}
		vector(size_t n, const T& value = T())
			:_start(nullptr)
			, _finish(nullptr)
			, _endOfStorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; ++i)
			{
				push_back(value);
			}
		}
		//模板 用迭代器构造
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)
			:_start(nullptr)
			, _finish(nullptr)
			, _endOfStorage(nullptr)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

  10. 拷贝构造和赋值重载

        这里就直接用现代写法

拷贝构造:用迭代器区间构造一个tmp,用自己写的交换函数将他们两的空间进行交换,结束后tmp自动析构。

赋值重载:在传参的时候就已经拷贝构造了一个对象,直接进行交换。这里还有个问题每处理,但是不处理问题也不大,就是自己给自己赋值,虽然说代价(时间消耗)可能会比较大,但是结果没问题,而且也不会有人傻傻的总是自己给自己赋值。

	    //v(v1) 拷贝构造
		vector(const vector<T>& v)
			:_start(nullptr)
			, _finish(nullptr)
			, _endOfStorage(nullptr)
		{
			vector<T> tmp(v.begin(),v.end());
			swap(tmp);
			
		}
		//赋值重载
		vector<T>& operator= (vector<T> v)
		{
			swap(v);
			return *this;
		}

  操作演示:

完整代码:Vector/Vector/Vector.h · 晚风不及你的笑/作业库 - 码云 - 开源中国 (gitee.com)https://gitee.com/auspicious-jing/job-library/blob/master/Vector/Vector/Vector.h