ARM_C高级学习笔记(三)C语言中的字符串类型

C语言的字符串类型

  • 很多高级语言像java、C#等就有字符串类型,有个String来表示字符串,用法和int这些很像,可以String s1 = “linux”;来定义字符串类型的变量。
  • C语言没有String类型,C语言中的字符串是通过字符指针来间接实现的。

C语言使用指针来管理字符串

  • C语言中定义字符串方法:char *p = "linux";此时p就叫做字符串,但是实际上p只是一个字符指针(本质上就是一个指针变量,只是p指向了一个字符串的起始地址而已)。

  • C语言中字符串的本质:指针指向头、固定尾部的地址相连的一段内存

    • (1)字符串就是一串字符。字符反映在现实中就是文字、符号、数字等人用来表达的字符,反映在编程中字符就是字符类型的变量。C语言中使用ASCII编码对字符进行编程,编码后可以用char型变量来表示一个字符。字符串就是多个字符打包在一起共同组成的。
    • (2)字符串在内存中其实就是多个字节连续分布构成的(类似于数组,字符串和字符数组非常像)
    • (3)C语言中字符串有3个核心要点:
    用一个指针指向字符串头
    固定尾部(字符串总是以’\0’来结尾)
    组成字符串的各字符彼此地址相连
    • ’\0’是一个ASCII字符,其实就是编码为0的那个字符(真正的0,和数字0是不同的,数字0有它自己的ASCII编码)。要注意区分’\0’和’0’和0.(0等于’\0’,'0’等于48
    • ‘\0’作为一个特殊的数字被字符串定义为(幸运的选为)结尾标志。产生的副作用就是:字符串中无法包含’\0’这个字符。
  • 注意:指向字符串的指针和字符串本身是分开的两个东西

    • char *p = “linux”;在这段代码中,p本质上是一个字符指针,占4字节;"linux"分配在代码段,占6个字节;实际上总共耗费了10个字节,这10个字节中:4字节的指针p叫做字符串指针(用来指向字符串的,理解为字符串的引子,但是它本身不是字符串),5字节的用来存linux这5个字符的内存才是真正的字符串,最后一个用来存’\0’的内存是字符串结尾标志(本质上也不属于字符串)。
  • 存储多个字符的2种方式:字符串和字符数组

    • 我们有多个连续字符(典型就是linux这个字符串)需要存储,实际上有两种方式:第一种就是字符串;第二种是字符数组。

字符串和字符数组的细节

  • 符数组初始化与sizeof、strlen
    • sizeof是C语言的一个关键字,也是C语言的一个运算符(sizeof使用时是sizeof(类型或变量名)sizeof运算符用来返回一个类型或者是变量所占用的内存字节数。为什么需要sizeof?主要原因一是int、double等原生类型占几个字节和平台有关;二是C语言中除了ADT之外还有UDT,这些用户自定义类型占几个字节无法一眼看出,所以用sizeof运算符来让编译器帮忙计算。
    • strlen是一个C语言库函数,这个库函数的原型是:size_t strlen(const char *s);这个函数接收一个字符串的指针,返回这个字符串的长度(以字节为单位)。注意一点是:==strlen返回的字符串长度是不包含字符串结尾的’\0’的。==我们为什么需要strlen库函数?因为从字符串的定义(指针指向头、固定结尾、中间依次相连)可以看出无法直接得到字符串的长度,需要用strlen函数来计算得到字符串的长度。
    • sizeof(数组名)得到的永远是数组的元素个数(也就是数组的大小),和数组中有无初始化,初始化多、少等是没有关系的;strlen是用来计算字符串的长度的,只能传递合法的字符串进去才有意义,如果随便传递一个字符指针,但是这个字符指针并不是字符串是没有意义的。
    • 当我们定义数组时如果没有明确给出数组大小,则必须同时给出初始化式,编译器会根据初始化式去自动计算数组的大小(数组定义时必须给出大小,要么直接给,要么给初始化式
    • 举例
#include <stdio.h>
#include <string.h>
int main(void)
{
	char a[5] = {1,0,2,3,4};               // 结果
	printf("sizeof = %d.\n", sizeof(a));   // 5
	printf("strlen = %d.\n", strlen(a));   // 1     //a[1] = 0; 0就是'\0'所以strlen的结果为1
	
	char b[5] = "linux"; //数组溢出                  //如果字符的个数大于等于字符数组的大小,                                          
	printf("sizeof = %d.\n", sizeof(b));   // 5     //那么strlen()的返回值就无法确定了
	printf("strlen = %d.\n", strlen(b));   // >=5   //因为b的结尾不是0,strlen()会继续向后检索,
	                                                //直到遇到'\0',而这些区域的内容是不确定的。
	char c[5] = "hal";
	printf("sizeof = %d.\n", sizeof(c));   // 5
	printf("strlen = %d.\n", strlen(c));   // 3
	
	return 0;
}

字符数组与字符串的本质差异(内存分配角度)

  • 字符数组char a[] = “linux”;来说,定义了一个数组a,数组a占6字节,右值"linux"本身只存在于编译器中,编译器将它用来初始化字符数组a后丢弃掉(也就是说内存中是没有"linux"这个字符串的);这句就相当于是:char a[] = {‘l’, ‘i’, ‘n’, ‘u’, ‘x’, ‘\0’};
  • 字符串char *p = “linux”;定义了一个字符指针p,p占4字节,分配在栈上;同时还定义了一个字符串"linux",分配在代码段;然后把代码段中的字符串(一共占6字节)的首地址(也就是’l’的地址)赋值给p。
  • 总结对比:字符数组和字符串有本质差别。字符数组本身是数组,数组自身自带内存空间,可以用来存东西(所以数组类似于容器);而字符串本身是指针,本身永远只占4字节,而且这4个字节还不能用来存有效数据,所以只能把有效数据存到别的地方,然后把地址存在p中。
    也就是说字符数组自己存那些字符;字符串一定需要额外的内存来存那些字符,字符串本身只存真正的那些字符所在的内存空间的首地址。
发布了21 篇原创文章 · 获赞 6 · 访问量 416

猜你喜欢

转载自blog.csdn.net/weixin_44112805/article/details/105146002
今日推荐