简介:
string 是 C++ 中常用的一个类,它非常重要,我们有必要在此单独讲解一下。
使用 string 类需要包含头文件
#include#include using namespace std; int main(){ string s1; string s2 ="c plus plus"; string s3 =s2; string s4(5,'s'); return0; }
变量 s1 只是定义但没有初始化,编译器会将默认值赋给 s1,默认值是"",也即空字符串。
变量 s2 在定义的同时被初始化为"c plus plus"。与C风格的字符串不同,string 的结尾没有结束标志' '。
变量 s3 在定义的时候直接用 s2 进行初始化,因此 s3 的内容也是"c plus plus"。
变量 s4 被初始化为由 5 个's'字符组成的字符串,也就是"sssss"。
从上面的代码可以看出,string 变量可以直接通过赋值操作符=进行赋值。string 变量也可以用C风格的字符串进行赋值,例如,
s2 是用一个字符串常量进行初始化的,而 s3 则是通过 s2 变量进行初始化的。
与C风格的字符串不同,当我们需要知道字符串长度时,可以调用 string 类提供的 length() 函数。如下所示:
string s ="http://c.biancheng.net"; intlen =s.length(); cout<输出结果为22。由于 string 的末尾没有' '字符,所以 length() 返回的是字符串的真实长度,而不是长度 +1。
转换为C风格的字符串虽然 C++ 提供了 string 类来替代C语言中的字符串,但是在实际编程中,有时候必须要使用C风格的字符串(例如打开文件时的路径),
为此,string 类为我们提供了一个转换函数 c_str(),该函数能够将 string 字符串转换为C风格的字符串,并返回该字符串的 const 指针(const char*)。
请看下面的代码:
string path ="D:\demo.txt"; FILE *fp =fopen(path.c_str(),"rt");为了使用C语言中的 fopen() 函数打开文件,必须将 string 字符串转换为C风格的字符串。
string 字符串的输入输出string 类重载了输入输出运算符,可以像对待普通变量那样对待 string 变量,也就是用>>进行输入,用<<进行输出。请看下面的代码:
#include#include using namespace std; int main() { string s; cin>>s;//输入字符串 cout< 运行结果:
abc def虽然我们输入了两个由空格隔开的网址,但是只输出了一个,这是因为输入运算符>>默认会忽略空格,遇到空格就认为输入结束,
所以最后输入的http://vip.biancheng.net没有被存储到变量 s。
访问字符串中的字符string 字符串也可以像C风格的字符串一样按照下标来访问其中的每一个字符。string 字符串的起始下标仍是从 0 开始。请看下面的代码:
#include#include usingnamespacestd; int main() { string s ="1234567890"; for(inti=0,len=s.length();i 运行结果:
1 2 3 4 5 6 7 8 9 0 1234557890本例定义了一个 string 变量 s,并赋值 "1234567890",之后用 for 循环遍历输出每一个字符。借助下标,除了能够访问每个字符,
也可以修改每个字符,s[5] = '5';就将第6个字符修改为 '5',所以 s 最后为 "1234557890"。
字符串的拼接有了 string 类,我们可以使用+或+=运算符来直接拼接字符串,非常方便,再也不需要使用C语言中的 strcat()、strcpy()、malloc() 等函数来拼接字符串了,
再也不用担心空间不够会溢出了。
用+来拼接字符串时,运算符的两边可以都是 string 字符串,也可以是一个 string 字符串和一个C风格的字符串,还可以是一个 string 字符串和一个字
数组,或者是一个 string 字符串和一个单独的字符。请看下面的例子:
#include#include using namespace std; int main() { string s1 ="first "; string s2 ="second "; char*s3 ="third "; chars4[]="fourth "; charch ='@'; string s5 =s1 +s2; string s6 =s1 +s3; string s7 =s1 +s4; string s8 =s1 +ch; cout< 运行结果:
first second first third first fourth first @string 字符串的增删改查C++ 提供的 string 类包含了若干实用的成员函数,大大方便了字符串的增加、删除、更改、查询等操作。
1. 插入字符串insert() 函数可以在 string 字符串中指定的位置插入另一个字符串,它的一种原型为:
string& insert (size_t pos, const string& str);
pos 表示要插入的位置,也就是下标;str 表示要插入的字符串,它可以是 string 字符串,也可以是C风格的字符串。
请看下面的代码:
#include#include using namespace std; intmain() { string s1,s2,s3; s1 =s2 ="1234567890"; s3 ="aaa"; s1.insert(5,s3); cout< 运行结果:
12345aaa67890 12345bbb67890insert() 函数的第一个参数有越界的可能,如果越界,则会产生运行时异常,我们将会在《C++异常(Exception)》一章中详细讲解如何捕获这个异常。
更多 insert() 函数的原型和用法请参考: string::insert - C++ Reference
2. 删除字符串erase() 函数可以删除 string 中的一个子字符串。它的一种原型为:
string& erase (size_t pos = 0, size_t len = npos);
pos 表示要删除的子字符串的起始下标,len 表示要删除子字符串的长度。如果不指明 len 的话,那么直接删除从 pos 到字符串结束处的所有字符(此时 len = str.length - pos)。
请看下面的代码:
#include#include using namespace std; int main() { string s1,s2,s3; s1 =s2 =s3 ="1234567890"; s2.erase(5); s3.erase(5,3); cout< 运行结果:
1234567890 12345 1234590有读者担心,在 pos 参数没有越界的情况下, len 参数也可能会导致要删除的子字符串越界。但实际上这种情况不会发生,erase() 函数会从以下两
个值中取出最小的一个作为待删除子字符串的长度:
- len 的值;
- 字符串长度减去 pos 的值。
说得简单一些,待删除字符串最多只能删除到字符串结尾。
3. 提取子字符串substr() 函数用于从 string 字符串中提取子字符串,它的原型为:
string substr (size_t pos = 0, size_t len = npos) const;
pos 为要提取的子字符串的起始下标,len 为要提取的子字符串的长度。
请看下面的代码:
#include#include using namespace std; int main() { string s1 ="first second third"; string s2; s2 =s1.substr(6,6); cout< 运行结果:
first second third second系统对 substr() 参数的处理和 erase() 类似:
4. 字符串查找
- 如果 pos 越界,会抛出异常;
- 如果 len 越界,会提取从 pos 到字符串结尾处的所有字符。
string 类提供了几个与字符串查找有关的函数,如下所示。
1) find() 函数
find() 函数用于在 string 字符串中查找子字符串出现的位置,它其中的两种原型为:
size_t find (const string& str, size_t pos = 0) const;
size_t find (const char* s, size_t pos = 0) const;
第一个参数为待查找的子字符串,它可以是 string 字符串,也可以是C风格的字符串。第二个参数为开始查找的位置(下标);如果不指明,
则从第0个字符开始查找。
请看下面的代码:
#include#include using namespace std; int main() { string s1 ="first second third"; string s2 ="second"; intindex =s1.find(s2,5); if(index 运行结果:
Found at index : 6find() 函数最终返回的是子字符串第一次出现在字符串中的起始下标。本例最终是在下标6处找到了 s2 字符串。如果没有查找到子字符串,那么会
返回一个无穷大值 4294967295。
String 、 char比较
string
char*、char[]
头文件
#include
不需要
定义与初始化
string s1(“abc”);
string s2(s1);
string s3(4, ‘s’);//初始化为4个’s’
char* a = “test”;//数据存在静态存储区,不能修改
char a[] = “test”;//开辟数组再存储,可以修改
char* a = new char[10];
memset(a, ‘0’, sizeof(char)*10);
相互转化
char* p = “hello”;
string s(p);
s = p;
string str(“test”);
const char* p = str.data();//记得要加const或者强制类型转换成(char*)
const char* p = str.c_str();
char p[10];
std::size_t length = str.copy(p,5,0);//从第0个开始复制5个,返回有效复制的数量,需要在p最后添加’ ’
char * cstr = new char [str.length()+1];
std::strcpy (cstr, str.c_str());
或者逐个复制
实际大小
str.size()
std::strlen(p)//#include
(C++写法)或者 (C写法) 容器大小
str.capacity()
数组形式p[],可以使用sizeof(p)来获得数组大小
指针形式没有容器概念,除非是new的,对指针用sizeof将得到指针本身的大小,由系统位数决定
倒置
#include // std::reverse
std::reverse(str.begin(),str.end());
char* strrev(char* s);
查找字符&字符串
find//从头开始找
rfind//从尾开始找
这四个函数都有四种重载:
size_t find (const string& str, size_t pos = 0);//查找子string,默认从父string的第0个字符开始,如果要查找多个相似的,则可以将pos设置为上次查找到的+1
size_t find (const char* s, size_t pos = 0);//查找字符串,默认从0开始
size_t find (const char* s, size_t pos, size_type n);//同上,但只比较n个
size_t find (char c, size_t pos = 0);//比较字符。
当然,形参初始化的值可能不一样,返回的都是地址索引,需要通过found!=std::string::npos判断是否有效。
char* strchr(char* s, char c);//查找字符串s中首次出现字符c的位置,返回c位置的指针,如不存在返回NULL
char * strrchr(const char str, int c);//查找字符倒数第一次出现的位置
char *strstr(const char *s1,const char *s2);//查找第一次出现s2的位置,返回s2的位置指针,如不存在返回NULL
char *strrstr(const char *s1,const char *s2);//查找倒数第一个出现s2的位置
int strspn(const char s,const char accept);//作用同右侧find_first_not_of。返回s中第一个没有在accept出现的字符的索引。通过两个for循环来实现
int strcspn(const char s,const char *reject);//返回s中第一个在reject出现的字符的索引
大小写转换
两者都是不提供这个功能的,但是C++有两个库函数,头文件是#include
: int tolower ( int c );
int toupper ( int c );
实现也很简单:
int tolower(int c)
{
if ((c >= ‘A’) && (c <= ‘Z’))
return c + (‘a’ - ‘A’);
return c;
}
比较字符串大小
一共五种重载形式
int compare (const string& str);
int compare (size_t pos, size_t len, const string& str);
int compare (size_t pos, size_t len, const string& str, size_t subpos, size_t sublen);
int compare (const char* s) const;
int compare (size_t pos, size_t len, const char* s);
int compare (size_t pos, size_t len, const char* s, size_t n);
返回与右边一致,其中pos表示从str的第几个元素开始比较,一共比较len个字符,如果不够,则有多少比较多少。subpos、sublen是相对比较字符串而言的
string重载了==、<等符号,可以直接用符号比较
string没有提供不区分大小写的比较,感觉可以读取出数据后通过右侧的函数来进行比较。
int strcmp(char* s1, char* s2);//区分字母大小写比较
当s1 < s2时,返回值<0; //对于第一个不相等的字符,s1对应的小于s2对应的,或者全相等,但是s1的字符数量少于s2的字符数量
当s1 = s2时,返回值=0;
当s1 > s2时,返回值>0。
int stricmp(char* s1, char* s2);//不区分字母大小写
int strncmp(char* s1, char* s2, int n);//只比较前n个字符,区分大小
int strnicmp(char* s1, char* s2, int n);//之比较前n,不区分大小写
数字转字符串
1、stringstream(多次使用需要使用clear()清除)
int N = 10;
stringstream ss;//#include
string str;
ss « N;
ss » str;
2、string = std::to_string(N)方法
只需包含
头文件即可 1、使用sprintf:#include
char c[100];
int k=255;
sprintf(c,”%d”,k);//d是有符号10进制数,u是无符号10进制
double a=123.321;
sprintf(c,”%.3lf”,a);
sprintf(c,”%x”,k);//转换成16进制,如果想要大写的话可以用X,8进制是o
//c包含”ff” c[0]=’f’ c[1]=’f’
2、itoa貌似跟平台有关,不建议使用。
字符串转数字
1、N = stringToNum
(str);//需要#include 2、在
中实现的 int stoi (const string& str, size_t* idx = 0, int base = 10);//idx返回第一个非数字的指针索引,base默认10进制
long stol、unsigned long stoul、long long stoll、unsigned long long stoull、float stof、double stod、long double stold
3、stringstream//#include
string a = “123.32”;
double res;
stringstream ss;
ss « a;
ss » res;
char a[10] = {“255”};
int b;
sscanf(a,”%d”,&b);
char a[10] = {“ff”};//十六进制
int b;
sscanf(a,”%x”,&b);
char str[]=”123.321”;
double a;
sscanf(str,”%lf”,&a);
另外也可以用atoi(),atol(),atof()
拷贝与合并
char p[10];
std::size_t length = str.copy(p,5,0);//从第0个开始复制5个,返回有效复制的数量,需要在p最后添加’ ’
合并直接用+号即可
或者用.append()
string& append (const string& str);
string& append (const string& str, size_t subpos, size_t sublen);
string& append (const char* s);
string& append (const char* s, size_t n);
string& append (size_t n, char c);
char* strcpy(char* dest, char* src);//把从src地址开始且含有 ‘ ’结束符的字符串复制到以dest开始的地址空间。返回指向dest的指针。
char* strncpy(char* dest, char* src, int size_tn);//复制n个,这个复制不保证NULL结尾,需要自己初始化。
char* strcat(char* dest, char* src);//把src所指字符串添加到dest结尾处(覆盖dest结尾处的 ‘ ’)并添加 ‘ ’。返回指向dest的指针。且内存不可重叠。
char* strncat(char* dest, char* src, int n);//部分合并
用sprintf也行,但是效率不高。
字符串切割
string substr (size_t pos = 0, size_t len = npos):
std::string str2 = str.substr (3,5);//返回str的第3个开始的5个元素。可以配合find函数来实现针对特殊元素的切割
char* strtok (char* str,constchar* delimiters );//以delimiters中的每个字符作为分割符,将str剪切,返回一个个字符串。传入NULL时代表继续切割后续的。下面的程序预计输出hello boy this is heima。第二个参数可以是” ,tn\“等。(其实就是将被切割的换成’ ’?待分割字符串的完整性会被破坏,而且线程不安全。具体分析请看strtok的安全性探讨)



