STL string 的各种效能剖析 以及char字符串与string串的互相转换
string的好处 :
不用担心内存是否足够、字符串长度等等,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作,==
进行比较,+ 做串联(是不是很简单?)。我们尽可以把它看成是C++的基本数据类型。
为了在我们的程序中使用string类型,我们必须包含头文件 <string>。如下:
#include <string>
1.声明一个C++字符串
a) string s; //生成一个空字符串s
b) string s(str) //拷贝构造函数 生成str的复制品 但是只有初始化的时候才能这样赋值
c) string s(str,idx) //将str 内字符串跳过idx个字符后赋值进s
例如:
#include<string>
#include<string>
#include<iostream>
using namespace std;
int main()
{
char s[100];
string str1;
while(cin>>str1)
{
string str2(str1,2);//输入1234 输出34 表示跳过2个之后开始赋值
cout<<str2<<endl;
}
return 0;
}
d) string s(str,idx,strlen) //在str中跳过idx个字符后 复制strlen个字符进s
e) string s(cstr) // 将char型的字符串转化进string型的 s
f) string s(chars,len) //将Char型字符串前len个字符作为字符串s的初值。 注意string的这个用法和char型的这个用法的区别
#include<string>
#include<iostream>
using namespace std;
int main()
{
char s[100];
while(scanf("%s",s))
{
string str2(s,2);
cout<<str2<<endl;
}
return 0;
}
g) string s(num,c) // 生成一个长度为num的字符串 字符全部是c
h) string s(beg,end) //以区间beg;end(不包含end)内的字符作为字符串s的初值
i) s.~string() //销毁所有字符,释放内存
2.字符串操作函数
这里是C++字符串的重点,我先把各种操作函数罗列出来,不喜欢把所有函数都看完的人可以在这里找自己喜欢的函数,再到后面看他的详细解释。
a) =,assign() //赋以新值
b) swap() //交换两个字符串的内容
#include<string>
#include<iostream>
using namespace std;
int main()
{
string s1,s2;
while(cin>>s1>>s2)
{
s1.swap(s2);//这样可以直接交换s1 和s2 省去了第三个中间变量
cout<<s1<<endl<<s2<<endl;
}
return 0;
}
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase() //删除字符
f) clear() //删除全部字符
g) replace() //替换字符
h) + //串联字符串
i) ==,!=,<,<=,>,>=,compare() //比较字符串
j) size(),length() //返回字符数量
k) max_size() //返回字符的可能最大个数
l) empty() //判断字符串是否为空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量内存以容纳一定数量的字符
o) [ ], at() //存取单一字符
p) >>,getline() //从stream读取某值
q) << //将谋值写入stream
r) copy() //将某值赋值为一个C_string
s) c_str() //将内容以C_string返回
t) data() //将内容以字符数组形式返回
u) substr() //返回某个子字符串
v)查找函数
w)begin() end() //提供类似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
2.1 C++字符串和C字符串的转换
C
++提供的由C++字符串得到对应的C_string的方法是使用data()、c_str()和copy(),其中,data()以字符数组的形式返回字符串内容,但并不添加’\0’。c_str()返回一个以‘\0’结尾的字符数组,而copy()则把字符串的内容复制或写入既有的c_string或
字符数组内。C++字符串并不以’\0’结尾。我的建议是在程序中能使用C++字符串就使用,除非万不得已不选用c_string。
可以这样直接将c字符串赋值给string
char s[100];
scanf("%s",s)
s2=s;
#include<iostream>
using namespace std;
int main()
{
string s1,s2;
while(1)
{
char s[100];
cin>>s1;
strcpy(s,s1.c_str());
cout<<s<<endl;
}
return 0;
}
2.2 大小和容量函数
一个C++字符 串存在三种大小:a)现有的字符数,函数是size()和length(),他们等效。Empty()用来检查字符串是否为空。b)max_size()
这个大小是指当前C++字符串最多能包含的字符数,很可能和机器本身的限制或者字符串所在位置连续内存的大小有关系。我们一般情况下不用关心他,应该大小足够我们用的。但是不够用的话,会抛出length_error异常c)capacity()重新分配内存之前
string所能包含的最大字符数。这里另一个需要指出的是reserve()函数,这个函数为string重新分配内存。重新分配的大小由其参数决定,
默认参数为0,这时候会对string进行非强制性缩减。
还有必要再重复一下C++字符串和C字符串转换的问
题,许多人会遇到这样的问题,自己做的程序要调用别人的函数、类什么的(比如数据库连接函数Connect(char*,char*)),但别人的函数参
数用的是char*形式的,而我们知道,c_str()、data()返回的字符数组由该字符串拥有,所以是一种const
char*,要想作为上面提及的函数的参数,还必须拷贝到一个char*,而我们的原则是能不使用C字符串就不使用。那么,这时候我们的处理方式是:如果
此函数对参数(也就是char*)的内容不修改的话,我们可以这样C((char*)s1.c_str(), (char*)s2.c_str()),但是这时候是存在危险的,因为这样转换后的字符串其实是可以修改的(有兴趣地可以自己试一试),所以我强调除非函数调用的时候不对参数进行修改,否则必须拷贝到一个char*上去。当然,更稳妥的办法是无论什么情况都拷贝到一个char*上去。同时我们也祈
祷现在仍然使用C字符串进行编程的高手们(说他们是高手一点儿也不为过,也许在我们还穿开裆裤的时候他们就开始编程了,哈哈…)写的函数都比较规范,那样
我们就不必进行强制转换了。
2.3元素存取
我们可以使用下标操作符[]和函数at()对元素包含的字符进行访问。但是应该注意的是操作符[]并不检查索引是否有效(有效索引0~str.length()),如果索引失效,会引起未定义的行为。而at()会检查,如果使用
at()的时候索引无效,会抛出out_of_range异常。
有一个例外不得不说,const string
a;的操作符[]对索引值是a.length()仍然有效,其返回值是’\0’。其他的各种情况,a.length()索引都是无效的。举例如下:
const string Cstr("const string");
string Str("string");
Str[3]; //ok
Str.at(3); //ok
Str[100]; //未定义的行为
Str.at(100); //throw out_of_range
Str[Str.length()] //未定义行为
Cstr[Cstr.length()] //返回 ‘\0’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) ////throw out_of_range
我不赞成类似于下面的引用或指针赋值:
char& r=s[2];
char* p= &s[3];
因为一旦发生重新分配,r,p立即失效。避免的方法就是不使用。
2.4比较函数
C ++字符串支持常见的比较操作符(>,>=,<,<=,==,!=),甚至支持string与C-string的比较(如 C——stirng 即c语言中的char型字符串
str<"hello")。在使用>,>=,<,<=这些操作符的时候是根据"当前字符特性"将字符按字典顺序进行逐一得
比较。字典排序靠前的字符小,比较的顺序是从前向后比较,遇到不相等的字符就按这个位置上的两个字符的比较结果确定两个字符串的大小。同时,string
("aaaa") <string(aaaaa)。
另一个功能强大的比较函数是成员函数compare()。他支持多参数处理,支持用索引值和长度定位子串来进行比较。他返回一个整数来表示比较结果,返回值意义如下:0-相等
〉0-大于 <0-小于。举例如下:
string s("abcd");
s.compare("abcd"); //返回0
s.compare("dcba"); //返回一个小于0的值
s.compare("ab"); //返回大于0的值
s.compare(s); //相等
s.compare(0,2,s,2,2); //s中的从零开始向后2为 即"ab"和s中的从第2个位置开始不包括第二个向后推2个即"cd"进行比较 小于零
s.compare(1,2,"bcx",2); //用"bc"和bcx从0个位置开始向后推2为即"bc"比较。
例
string中compare函数的使用
#include <iostream>
#include <string>
using namespace std;
#define csize 50
int main()
{
string s("hello,world!");
string str("hello,motto");
char *cp=new char[csize];
string strcin;
cout<<"请输入一个字符串(大小小于50个字符):"<<endl;
cin>>strcin;
/* getline(cin,strcin);*/
int strsize=strcin.size();
for (int i=0;i<strsize;i++)
{
cp[i]=strcin[i];
}
if (s.compare(str))
{
cout<<"s的值"<<s<<"大于str的值!"<<str<<endl;
}
else if (str.compare(s))
{
cout<<"str的值"<<str<<"大于s的值!"<<s<<endl;
}
else
cout<<"s的值"<<s<<"等于str的值!"<<str<<endl;
if (s.compare(cp))
{
cout<<"s的值大于cp数组的值"<<endl;
}
else if (s.compare(cp)<0)
{
cout<<"s的值小于cp数组的值"<<endl;
}
else
cout<<"s的值等于cp数组的值"<<endl;
if (s.compare(0,6,str,0,6))
{
cout<<"s的前六个字符大于str的前六个字符"<<endl;
}
else if (str.compare(0,6,s,0,6))
{
cout<<"s的前六个字符小于str的前六个字符"<<endl;
}
else
cout<<"s的前六个字符等于str的前六个字符"<<endl;
return 0;
}
2.5 更改内容
这在字符串的操作中占了很大一部分。
首先讲赋值,第一个赋值方法当然是使用操作符=,新值可以是string(如:s=ns)
、c_string(如:s="gaint")甚至单一字符(如:s=’j’)。还可以使用成员函数assign(),这个成员函数可以使你更灵活的对字符串赋值。还是举例说明吧:
s.assign(str); //不说
s.assign(str,1,3);//如果str是"iamangel" 就是把"ama"赋给字符串
s.assign(str,2,string::npos);//把字符串str从索引值2开始到结尾赋给s
s.assign("gaint"); //不说
s.assign("nico",5);//把’n’ ‘I’ ‘c’ ‘o’ ‘\0’赋给字符串
s.assign(5,’x’);//把五个x赋给字符串
把字符串清空的方法有三个:s="";s.clear();s.erase();(我越来越觉得举例比说话让别人容易懂!)。
string提供了很多函数用于插入(insert)、删除(erase)、替换(replace)、增加字符。
先说增加字符(这里说的增加是在尾巴上),函数有 +=、append()、push_back()。举例如下:
s+=s;//加个字符串 或者本身相加
s+="my name is jiayp";//加个C字符串
s+=’a’;//加个字符
s.append(str);
s.append(str,1,3);//不解释了 同前面的函数参数assign的解释
s.append(str,2,string::npos)//不解释了 从第3个加到末尾
s.append("my name is jiayp");
s.append("nico",5);
s.append(5,’x’);
s.push_back(‘a’);//这个函数只能增加单个字符 对STL熟悉的理解起来很简单
也许你需要在string中间的某个位置插入字符串,这时候你可以用insert()函数,这个函数需要你指定一个安插位置的索引,被插入的字符串将放在这个索引的后面。
s.insert(0,"my name");
s.insert(1,str);
这 种形式的insert()函数不支持传入单个字符,这时的单个字符必须写成字符串形式
例如 s1.insert(1,"b");
删除函数erase()的形式也有好几种(真烦!),替换函数replace()也有好几个。举例吧:
string s="il8n";
s.replace(1,2,"nternationalizatio");//从第1个后面的2个变为后面的C_string 如果是1234 会变成1nternationalizatio4
s.erase(13);//从索引13开始往后全删除
s.erase(7,5);//从索引7开始往后删5个
2.6提取子串和字符串连接
题取子串的函数是:substr(),形式如下:
s.substr();//返回s的全部内容
s.substr(11);//从索引11往后的子串
s.substr(5,6);//从索引5开始6个字符
2.7输入输出操作
1.>> 从输入流读取一个string。
2.<< 把一个string写入输出流。
另一个函数就是getline(),他从输入流读取一行内容,直到遇到分行符或到了文件尾。
2.8搜索与查找
查找函数很多,功能也很强大,包括了:
find() 记住 返回的下标是从0开始的
rfind()
find_first_of()
find_last_of()
find_first_not_of()
find_last_not_of()
这些函数返回符合搜索条件的字符区间内的第一个字符的索引,没找到目标就返回npos。所有的函数的参数说明如下:
第一个参数是被搜寻的对象。第二个参数(可有可无)指出string内的搜寻起点索引,第三个参数(可有可无)指出搜寻的字符个数。比较简单,不多说不理解的可以向我提出,我再仔细的解答。当然,更加强大的STL搜寻在后面会有提及。
最
后再说说npos的含义,string::npos的类型是string::size_type,所以,一旦需要把一个索引与npos相比,这个索引值必须是string::size)type类型的,更多的情况下,我们可以直接把函数和npos进行比较(如:if(s.find("jia")==
string::npos))。
参考 :
参考文章作者:VCF