当前位置: 首页 > news >正文

C++【string的模拟实现】

在前文我们讲解了string类接口使用(C++【string类的使用】(上),C++【string类的使用】(下)),本片文章就来模拟实现string类。
注:本文实现的是string的部分重点内容,目的是为了更好的了解string,而不是实现出一个功能一模一样的string

文章目录

  • 1. 三个文件的链接
    • 1.1 string.h
    • 1.2 string.cpp
    • 1.3 test.cpp
  • 2. 正式实现
    • 2.1 string的内部成员变量
    • 2.2 构造函数
    • 2.3 析构函数
    • 2.4 拷贝构造
      • 1.深浅拷贝问题
      • 2. 传统写法
      • 3. 现代写法
    • 2.5 operator=
      • 传统写法
      • 现代写法
    • 2.6 常量成员对象npos
    • 2.7 提供C接口 c_str
    • 2.8 容量接口
    • 2.9 operator[]
    • 2.10 迭代器
    • 2.11 修改容量 reserve
    • 2.12 字符串的增加与删除
      • push_back
      • append
      • operator+=
      • insert
      • erase
    • 2.13 查找 find
    • 2.14 字串 substr
    • 2.15 string之间的比较
    • 2.16 重载输出流 operator<<
    • 2.17 重载输入流 operator>>
  • 3. 完整代码
    • string.h
    • string.cpp
    • test.cpp
  • 4. 结语

1. 三个文件的链接

1.1 string.h

负责string类函数的声明(一些短小且频繁调用的函数会在类里实现)
在这里插入图片描述

1.2 string.cpp

负责string类函数的实现
在这里插入图片描述

1.3 test.cpp

负责测试函数是否成功
在这里插入图片描述

2. 正式实现

2.1 string的内部成员变量

class string
{private:char* _str;size_t _size;size_t _capacity;const static size_t npos;
};
  • _str:是string类的关键,用来存放被开辟空间的地址
  • _size:非空字符的个数(string类的长度)
  • _capacity:string类当前的容量
  • _npos:静态成员函数,用来当缺省值

2.2 构造函数

我们就实现两个构造:无参构造与字符串构造。

注意:无参构造不能给_str一个nullptr,因为string本质上还是读取字符串,而字符串只有遇到\0才会停止读取,如果你给了一个空指针,那么在查找_str的时候就查找不到\0,就会一直找下去,这时的程序就已经无法使用了。

不管是无参构造,还是带参构造,都要有\0,但是我们的_capacity并不包含\0,所以我们在开空间的时候是要多开一个空间的。

		string():_str(new char[1]{'\0'}),_size(0),_capacity(0){}string(const char* str){_size = strlen(str);_capacity = _size; //capacity不包含 '/0'_str = new char[_size + 1];strcpy(_str, str);}

我们也可以将这两个函数合二为一,给const char* str一个缺省值就好了。

string(const char* str = ""){_size = strlen(str);_capacity = _size; //capacity不包含 '/0'_str = new char[_size + 1];strcpy(_str, str);}

注意:缺省值不需要给成const char* str ="\0",因为一个空字符串里面就默认包含了\0,如果我们在多给一个,里面就会存储两个\0,那就有点画蛇添足了。

2.3 析构函数

我们看到_str是申请了空间,那么编译器默认生成的析构就无法满足我们的需求了,我们就需要自己手搓一个析构函数。

其实析构就很简单,就是将申请的空间释放掉,将_str设置为空指针,你的_size和_capacity要不要置0都无所谓。

		~string(){delete[] _str;_str = nullptr;_size = _capacity = 0;}

既然有了析构,那么拷贝构造与operator=也需要我们自己手搓(他们是配套出现的)

2.4 拷贝构造

1.深浅拷贝问题

我们先看看没有手动实现拷贝构造,使用编译器默认的拷贝构造会发生什么事情。
在这里插入图片描述

在这里插入图片描述
可以看到发生了报错,那这么是为什么呢,我们结合图来一探究竟。
在这里插入图片描述
我们可以看到,这两个对象中_str的地址是一样的。
在这里插入图片描述
这是因为编译器默认生成的拷贝构造是每个字节每个字节的拷贝,这也就导致了s1,s2的_str都指向了同一块空间,当test函数结束,要需要销毁s1和s2,就会先销毁掉s2的_str,当s2的_str被销毁后,这个_str所指向的空间就已经被释放了,这时在销毁s1,就会使一个空间被释放两次,就会发生崩溃。
这种拷贝方式被称为浅拷贝。

浅拷贝就像一个家里有两个孩子,但只有一个玩具,当他们都想玩玩具,且只想自己玩的时候,就会你争我抢,导致玩具损坏。
在这里插入图片描述
可以用深拷贝来解决这个问题,,即:每个对象都有一份独立的资源,不要和其他对象共享。父母给每个孩子都买一份玩具,各自玩各自的就不会有问题了

如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。

2. 传统写法

		string(const string& s){_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;}

和构造函数思路一样,都是开辟一块新空间,然后拷贝数据

3. 现代写法

		string(const string& s):_str(nullptr){string tmp(s._str);swap(_str, tmp._str);swap(_size, tmp._size);swap(_capacity, tmp._capacity);}

这种写法非常巧妙,我们先用 s 的 _str 初始化一个临时变量tmp,然后将 tmp 的 _str 与 this 的 _str 交换,这样就完成了拷贝构造,同时也是深拷贝。
大致过程如下图:
在这里插入图片描述

2.5 operator=

和拷贝构造类似,也是有传统写法与现代写法。

传统写法

	string string::operator=(const string& s){if (this != &s)//判断是不是自己{delete[] _str;_str = new char[s._capacity + 1];strcpy(_str, s._str);_size = s._size;_capacity = s._capacity;}return *this;}

现代写法

	string string::operator=(string s){swap(_str,s._str);swap(_size, s._size);swap(_capacity, s._capacity);return *this;}

注意:这里函数参数string s,是传值传参,发生了拷贝构造,这是为了不影响 = 右边的对象。

传统写法中,我们还需要手动的销毁原空间,创建新空间,拷贝数据;但是在现代写法,这些都不需要了,新空间新数据已经被 s 开好了,我们只需要交换就好了。

接下来就开始实现常量成员对象npos与一些常用接口

2.6 常量成员对象npos

//常量成员对象
const size_t string::npos = -1;

npos的作用就是用来当缺省值,用来表示“到字符串结束”。

2.7 提供C接口 c_str

//只读字符串const char* c_str() const{return _str;}

提供只读字符串,返回 _str 即可, 这个_str 被const修饰,无法改变。

2.8 容量接口

查询容量,实现size()和capacity()即可。

		size_t size() const{return _size;}size_t capacity() const{return _capacity;}

2.9 operator[]

我们在使用那部分也讲过,返回对应位置的引用即可。

		char& operator[](size_t pos){assert(pos <= _size);return _str[pos];}//支持const版本char& operator[](size_t pos) const{assert(pos <= _size);return _str[pos];}

2.10 迭代器

之前已经提到过,现阶段我们可以将迭代器理解成一种指针,通过解引用来访问数据元素。我们定义string类时,使用指针来模拟迭代器。迭代器定义如下:

		typedef char* iterator;typedef const char* const_iterator;

我们只实现普通迭代器与const迭代器,反向迭代器后面再讲解。

		iterator begin(){return _str;}iterator end(){return _str + _size;}const_iterator cbgin() const{return _str;}const_iterator cend() const{return _str + _size;}

要想支持范围for,我们的名字必须和库里的名字一样,因为范围for是傻瓜式替换。

我们现在试验下我们自己实现的访问

	void test_string1(){string s1;string s2("zhuo zhuo zhuo");//cout << s1.c_str() << endl;//cout << s2.c_str() << endl;cout << "下标访问遍历:";for (int i = 0; i < s2.size(); i++){cout << s2[i] << ' ';}cout << endl;string::iterator sit = s2.begin();cout << "  迭代器遍历:";while (sit != s2.end()){cout << *sit << ' ';sit++;}cout << endl;cout << " 范围for遍历:";for (auto e : s2){cout << e << ' ';}}

在这里插入图片描述

2.11 修改容量 reserve

这个虽然不属于字符串的增加与删除,但是每个增加元素的函数都会用到他,所以我就把它提取到这个模块了

	void string::reserve(size_t n){if (n > _capacity){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}else;}

设计思路和vs是一样的,比原来的_capacity大我就扩容,比_capacity小都不扩容。

注意:到了C++,我们就要舍弃realloc()这个函数来扩容,全部都自己写,因为realloc无法自动调用构造函数,而new可以。

2.12 字符串的增加与删除

push_back

	void string::push_back(char ch){if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size++] = ch;_str[_size] = '\0';}

append

append有很多接口,我们实现一个尾插字符串就可以了

	void string::append(const char* str){size_t len = strlen(str);if (_size + len > _capacity){size_t NewCapacity = 2 * _capacity;reserve(_size + len > NewCapacity ? _size + len : NewCapacity);}strcpy(_str + _size, str);_size += len;}

operator+=

这个直接复用push_back()append()就好了。

string += 字符

	string& string::operator+= (char ch){push_back(ch);return *this;}

string += 字符串

	string& string::operator+= (const char* str){append(str);return *this;}

operator+=,push_back,append这三个都是在string尾部插入元素,要想直线在任意位置插入元素,那就需要insert这个函数。

insert

我们同样只实现两个版本,插入字符与插入字符串,这两个版本都是在指定位置之前插入元素

	    string类内部的声明void insert(size_t pos, char ch);//插入字符void insert(size_t pos, const char* str);//插入字符串
  1. insert插入字符

既然要在之前插入字符,那挪动数据的时候,也需要挪动原pos位置的元素。

	void string::insert(size_t pos, char ch){assert(pos <= _size);if (pos == _size){push_back(ch);}else{if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}//挪动数据size_t end = _size;while (end != pos-1){_str[end] = _str[end-1];--end;}_str[pos] = ch;_str[++_size] = '\0';

流程如下图
在这里插入图片描述

  1. insert插入字符串
	void string::insert(size_t pos, const char* str){assert(pos <= _size);if (pos == _size){append(str);}else{size_t len = strlen(str);if (_size + len > _capacity){size_t NewCapacity = 2 * _capacity;reserve(_size + len > NewCapacity ? _size + len : NewCapacity);}//挪动数据size_t end = _size+len;while (end != pos + len - 1){_str[end] = _str[end - len];--end;}//覆盖for (int i = 0; i < len; i++){_str[pos + i] = str[i];}_size += len;}}

注意:我们在挪动数据的时候,我们的结束条件一定不能写 e n d ≥ p o s end \ge pos endpos,因为在头插环境会无线循环。
在这里插入图片描述

在这里插入图片描述
所以就会无限循环

把 end 换成 int 类型行不行呢?
答案是不行的,这是C语言留下来的坑,当级别低的与级别高作为操作符的操作数时,级别低的变量会发生整形提升。
也就是说当end与pos位置比较的时候,end会自动提升为 size_t (unsigned_int) 类型

如果你把 pos 也改成 int 类型就能成功运行,但是我们要结合使用场景,如果我们要插入的字符位置是比int正整数最大值大一点的数字,那么我们就会插入到负输上,但字符串是没有负数这个概念的,所以将 end 和 pos 都换成 int 是不行的。

正确方法就是上文代码的方法while (end != pos-1)while (end != pos + len - 1),!= 这个操作符不需要比较位置之间的大小,只需要看是否相等,如果相等,就停下来跳出循环。

而 -1 是为了插入字符串,因为我们要在指定位置前插入字符串,如果不 -1,那么就会少挪动一位,导致原本的数据丢失一位。

erase

void erase(size_t pos, size_t len = npos);
	void string::erase(size_t pos, size_t len){assert(pos < _size);if (len > _size - pos){_str[pos] = '\0';_size = pos;}else{for (int i = pos + len; i <= _size; i++){_str[i - len] = _str[i];}_size -= len;}}

当要删除的字符个数大于_size后字符个数,直接在将pos位置置为\0,然后将_szie更新。

如果小于,那就把后面的值往前覆盖,长度-=要删减的字符个数。

2.13 查找 find

这个就很简单了,直接遍历string就好了,如果是查找字符串,那就直接调用C语言string库的strstr

	//查找字符size_t string::find(char ch, size_t pos){assert(pos < _size);for (int i = pos; i < _size; i++){if (_str[i] == ch){return i;}}return npos;}//查找字符串size_t string::find(const char* str, size_t pos){assert(pos < _size);const char* ptr = strstr(_str, str);if (ptr == nullptr){return npos;}else{return ptr - _str;}} 

2.14 字串 substr

直接在函数里创建一个临时变量,让他来拷贝子串,然后出函数的时候再进行构造函数来进行深拷贝

	string string::substr(size_t pos, size_t len) const{assert(pos < _size);if (len > _size - pos){len = _size - pos;}string sub;sub.reserve(len);for (int i = 0; i < len; i++){sub += _str[i + pos];}return sub;}

2.15 string之间的比较

我们直接调用strcmp就可以了,重载==加任意一个判断运算符(除!=),其他就可以直接复用。

	bool operator>(const string& s1, const string& s2){return strcmp(s1.c_str(), s2.c_str()) > 0;}bool operator>=(const string& s1, const string& s2){return (s1 > s2) || (s1 == s2);}bool operator<(const string& s1, const string& s2){return !(s1 >= s2);}bool operator<=(const string& s1, const string& s2){return !(s1 > s2);}bool operator==(const string& s1, const string& s2){return strcmp(s1.c_str(), s2.c_str()) == 0;}bool operator!=(const string& s1, const string& s2){return !(s1 == s2);}

2.16 重载输出流 operator<<

	ostream& operator<<(ostream& out, string& s){ //out << s.c_str();for (auto e : s){out << e;}return out;}

2.17 重载输入流 operator>>

	istream& operator>>(istream& in, string& s){char ch;ch = in.get();while (ch != ' ' && ch != '\n'){s += ch;ch = in.get();}return in;}

in.get()是输入流的一个函数,功能是在缓冲区中拿到空格和换行(一般的插入是不会读取的)。

3. 完整代码

string.h

#define _CRT_SECURE_NO_WARNINGS 1
#pragma once#include<iostream>
#include<assert.h>
using namespace std;
#include<algorithm>namespace zhuo
{class string{public:typedef char* iterator;typedef const char* const_iterator;//string()//	:_str(new char[1]{'\0'})//	,_size(0)//	,_capacity(0)//{}//string(const char* str)//{//	_size = strlen(str);//	_capacity = _size; //capacity不包含 '/0'//	_str = new char[_size + 1];//	strcpy(_str, str);//}string(const char* str = ""){_size = strlen(str);_capacity = _size; //capacity不包含 '/0'_str = new char[_size + 1];strcpy(_str, str);}//string(const string& s)//{//	_str = new char[s._capacity + 1];//	strcpy(_str, s._str);//	_size = s._size;//	_capacity = s._capacity;//}string(const string& s):_str(nullptr){string tmp(s._str);swap(_str, tmp._str);swap(_size, tmp._size);swap(_capacity, tmp._capacity);}~string(){delete[] _str;_str = nullptr;_size = _capacity = 0;}iterator begin(){return _str;}iterator end(){return _str + _size;}const_iterator cbgin() const{return _str;}const_iterator cend() const{return _str + _size;}const char* c_str() const{return _str;}char& operator[](size_t pos){assert(pos <= _size);return _str[pos];}char& operator[](size_t pos) const{assert(pos <= _size);return _str[pos];}size_t size() const{return _size;}size_t capacity() const{return _capacity;}void reserve(size_t);//增删void push_back(char ch);void append(const char* str);string& operator+= (char ch);string& operator+= (const char* str);void insert(size_t pos, char ch);void insert(size_t pos, const char* str);void erase(size_t pos, size_t len = npos);//查找size_t find(char ch, size_t pos = 0);size_t find(const char* str, size_t pos = 0);string substr(size_t pos = 0, size_t len = npos) const;//string operator=(const string& s);string operator=(string s);private:char* _str;size_t _size;size_t _capacity;const static size_t npos;};bool operator>(const string& s1, const string& s2);bool operator>=(const string& s1, const string& s2);bool operator<(const string& s1, const string& s2);bool operator<=(const string& s1, const string& s2);bool operator==(const string& s1, const string& s2);bool operator!=(const string& s1, const string& s2);ostream& operator<<(ostream& out, string& s);istream& operator>>(istream& in, string& s);
}

string.cpp

#include"string.h"namespace zhuo
{const size_t string::npos = -1;void string::reserve(size_t n){if (n > _capacity){char* tmp = new char[n + 1];strcpy(tmp, _str);delete[] _str;_str = tmp;_capacity = n;}else;}void string::push_back(char ch){if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}_str[_size++] = ch;_str[_size] = '\0';}void string::append(const char* str){size_t len = strlen(str);if (_size + len > _capacity){size_t NewCapacity = 2 * _capacity;reserve(_size + len > NewCapacity ? _size + len : NewCapacity);}strcpy(_str + _size, str);_size += len;}string& string::operator+= (char ch){push_back(ch);return *this;}string& string::operator+= (const char* str){append(str);return *this;}void string::insert(size_t pos, char ch){assert(pos <= _size);if (pos == _size){push_back(ch);}else{if (_size == _capacity){reserve(_capacity == 0 ? 4 : _capacity * 2);}//挪动数据size_t end = _size;while (end != pos-1){if (end == 0);_str[end] = _str[end-1];--end;}_str[pos] = ch;_str[++_size] = '\0';}}void string::insert(size_t pos, const char* str){assert(pos <= _size);if (pos == _size){append(str);}else{size_t len = strlen(str);if (_size + len > _capacity){size_t NewCapacity = 2 * _capacity;reserve(_size + len > NewCapacity ? _size + len : NewCapacity);}//挪动数据size_t end = _size+len;while (end >= pos + len - 1){_str[end] = _str[end - len];--end;}//覆盖for (int i = 0; i < len; i++){_str[pos + i] = str[i];}_size += len;}}void string::erase(size_t pos, size_t len){assert(pos < _size);if (len > _size - pos){_str[pos] = '\0';_size = pos;}else{for (int i = pos + len; i <= _size; i++){_str[i - len] = _str[i];}_size -= len;}}size_t string::find(char ch, size_t pos){assert(pos < _size);for (int i = pos; i < _size; i++){if (_str[i] == ch){return i;}}return npos;}size_t string::find(const char* str, size_t pos){assert(pos < _size);const char* ptr = strstr(_str, str);if (ptr == nullptr){return npos;}else{return ptr - _str;}} string string::substr(size_t pos, size_t len) const{assert(pos < _size);if (len > _size - pos){len = _size - pos;}string sub;sub.reserve(len);for (int i = 0; i < len; i++){sub += _str[i + pos];}return sub;}//string string::operator=(const string& s)//{//	if (this != &s)//	{//		delete[] _str;//		_str = new char[s._capacity + 1];//		strcpy(_str, s._str);//		_size = s._size;//		_capacity = s._capacity;//	}//	return *this;//}string string::operator=(string s){swap(_str,s._str);swap(_size, s._size);swap(_capacity, s._capacity);return *this;}bool operator>(const string& s1, const string& s2){return strcmp(s1.c_str(), s2.c_str()) > 0;}bool operator>=(const string& s1, const string& s2){return (s1 > s2) || (s1 == s2);}bool operator<(const string& s1, const string& s2){return !(s1 >= s2);}bool operator<=(const string& s1, const string& s2){return !(s1 > s2);}bool operator==(const string& s1, const string& s2){return strcmp(s1.c_str(), s2.c_str()) == 0;}bool operator!=(const string& s1, const string& s2){return !(s1 == s2);}ostream& operator<<(ostream& out, string& s){ //out << s.c_str();for (auto e : s){out << e;}return out;}istream& operator>>(istream& in, string& s){char ch;ch = in.get();while (ch != ' ' && ch != '\n'){s += ch;ch = in.get();}return in;}
}

test.cpp

#include"string.h"
#include<string>namespace zhuo
{void test_string1(){string s1;string s2("zhuo zhuo zhuo");//cout << s1.c_str() << endl;//cout << s2.c_str() << endl;cout << "下标访问遍历:";for (int i = 0; i < s2.size(); i++){cout << s2[i] << ' ';}cout << endl;string::iterator sit = s2.begin();cout << "  迭代器遍历:";while (sit != s2.end()){cout << *sit << ' ';sit++;}cout << endl;cout << " 范围for遍历:";for (auto e : s2){cout << e << ' ';}}void test_string2(){string s1;s1.push_back('a');s1 += 'b';cout << s1.c_str() << endl;s1.append(" hello");cout << s1.c_str() << endl;s1 += " world";cout << s1.c_str() << endl;s1.insert(0, 'c');cout << s1.c_str() << endl;s1.insert(0, "cccc");cout << s1.c_str() << endl;s1.erase(1, 100);cout << s1.c_str() << endl;string s2("hello world");s2.erase(1);cout << s1.c_str() << endl;string s3("0123456789");s3.erase(2,5);cout << s3.c_str() << endl;}void test_string3(){string s1("0123456789");size_t pos = s1.find('3');string s2 = s1.substr(pos);cout << s2.c_str() << endl;string s3("test.cpp.zip");pos = s3.find("cpp");string s4 = s3.substr(pos);cout << s4.c_str() << endl;}void test_string4(){string s1("hello world");cout << s1 << endl;cin >> s1;cout << s1 << endl;}void test_string5(){string s1("hello");string s2(s1);int s;}
}
int main()
{zhuo::test_string2();return 0;
}

4. 结语

那么这次的分享就到这里结束了~
string类还是比较简单的~
最后感谢您能阅读完此片文章~
如果您认为这篇文章对你有帮助的话,可以用你们的手点一个免费的赞并收藏起来哟~
如果有任何建议或纠正欢迎在评论区留言~
也可以前往我的主页看更多好文哦(点击此处跳转到主页)。


http://www.mrgr.cn/news/63966.html

相关文章:

  • ChatGPT国内中文版镜像网站整理合集(2024/11/01)
  • 使用wordcloud与jieba库制作词云图
  • 路由参数与请求方式
  • 蓝牙 BLE 详解
  • linux 原子操作
  • 2021李宏毅机器学习 1 机器学习基础 笔记
  • C语言学习,标准库 <stdarg.h>
  • World of Warcraft [CLASSIC][80][the Ulduar] BOSS 08 09 10 11
  • codeblocks-20.03mingw-setup.exe安装教程
  • “微软蓝屏”事件暴露了网络安全哪些问题?
  • 基于javase 的超市收银管理系统
  • 使用 OpenCV 在 Python 中绘制基本图形
  • 全国高校计算机能力挑战赛 Python
  • flutter ios ffi 调试 .a文件 debug可以 release 不行
  • RabbitMQ最全教程-Part2(高阶使用)
  • 嵌入式Linux系统中GPIO实验详解
  • vscode markdown-image 图片粘贴自动上传到本地目录设置
  • 什么品牌的护眼台灯比较好?五款护眼效果比较明显的护眼台灯
  • 对于图像的关键点数据提取openpose
  • 第三百零八节 Log4j教程 - Log4j日志到数据库
  • AWS RDS MySQL内存使用
  • Caffeine 手动策略缓存 put() 方法源码解析
  • Copilot功能
  • 单例模式的五种实现方式及优缺点
  • 从0开始学统计-什么是Z-score
  • 【国产MCU系列】-GD32F4开发环境搭建(基于Embedded Builder)