目录
最近学习C++时遇到了字符串的问题,结合之前的面试题深入分析下。
字符串库函数有strcpy、strlen、strstr等,可以参见C语言字符串操作总结大全。
1、strcpy()
strcpy():char *strcpy(char* dest, const char *src);返回指向dset的指针
strcpy()被认为是不安全的函数,因为它的函数实现非常简单,没有考虑异常情况。下面考虑两种情况:
a)如果src长度大于dest会发生什么?
linux man page里面提到了这个BUG:
If the destination string of a strcpy() is not large enough, then anything might happen. Overflowing fixed-length string buffers is a favorite cracker technique for taking complete control of the machine. Any time a program reads or copies data into a buffer, the program first needs to check that there's enough space. This may be unnecessary if you can show that overflow is impossible, but be careful: programs can get changed over time, in ways that may make the impossible possible.
大概意思是这样做固定长度的字符串就会发生溢出。如果程序没有事先检查内存空间,就会发生难以预料的事情。
写好代码:char a[2] = "a"; char b[10] = "bbbbbbbb"; auto p=strcpy(a, b); 在VS断点调试,步骤如下:
i.执行到strcpy函数之前,查看a和b的值和内存:
发现VS编译器以16进制数c来作为未被使用的内存,a后面还有6字节的空内存。
ii、执行strcpy,观察内存
发现a虽然只有2个字节的内存,但是后面的内存都被覆盖掉了(对比上下两图可以发现值为9f的这个内存被覆盖成00了,其他的CC被62填充)
iii、得出结论
会覆盖字符串数组之外的内存(数组越界)。假设数组b无限大,那岂不是把整个堆都覆盖掉了?果然这个函数非常危险,要改用strncpy()。
b)如果src长度小于dset呢?
src从头到\0都被复制到dset中,dest多余的部分没有变化(右图)。这种情况没什么问题。
c)手写strcpy
发现网上大家的代码都没能解决数组越界的问题,我加了一行代码 if (*dst == '\0') break; 目前看来没什么问题。
char* my_strcpy(char *dst, const char *src) {
assert(dst != NULL && src != NULL);//断言输入不为空,空则调用abort()异常终止进程
char *ret = dst;
while ((*dst = *src) != '\0') {
dst++;
src++;
if (*dst == '\0') break;//如果此时目标数组已经结束,就不用继续复制了
}
return ret;
}
调试发现运行结束时不会覆盖dst后面的内存了。
d)总结
在一本面试书上看到过,说这个函数是MS考虑到普适性,故意写的很简单。不过这个问题也很老了,只是凭兴趣研究下。总结起来就是程序员要注意内存溢出的问题,特别在使用指针的时候,这种小问题很可能会导致一些重大安全问题。
2、strlen()
size_t __cdecl strlen(const char * s){
int i = 0;
while( *s ) {
i++;
s++;
}
return i;
}
3、strcat()
char * __cdecl strcat(char * dst, const char * src){
char *p = dst;
while( *p )
p++;
while( *p ++ = *src ++ )
;
return dst;
}
4、strcmp()
int strcmp(const char *str1, const char *str2){
int ret=0;
while( !(ret = *(unsigned char*)str1 - *(unsigned char*)str2 ) && *str1 )
{
str1++;
str2++;
}
if(ret < 0)
return -1;
else if(ret > 0)
return 1;
return 0;
}