Daily-C-Study(23)：C语言数组应用

成于坚持，败于止步

一、数组的内存布局

先看下面的例子：

int a[5];

所有人都明白这里定义了一个数组，其包含了5 个int 型的数据。我们可以用a[0],a[1]等来访问数组里面的每一个元素，那么这些元素的名字就是a[0],a[1]…吗？看下面的示意图：

如上图所示，当我们定义一个数组a 时，编译器根据指定的元素个数和元素的类型分配确定大小（元素类型大小*元素个数）的一块内存，并把这块内存的名字命名为a。名字a 一旦与这块内存匹配就不能被改变。a[0],a[1]等为a 的元素，但并非元素的名字。数组的每一个元素都是没有名字的。

sizeof(a)的值为sizeof(int)*5，32 位系统下为20。

sizeof(a[0])的值为sizeof(int)，32 位系统下为4。

sizeof(a[5])的值在32 位系统下为4。并没有出错，为什么呢？我们讲过sizeof 是关键字不是函数。函数求值是在运行的时候，而关键字sizeof 求值是在编译的时候。虽然并不存在a[5]这个元素，但是这里也并没有去真正访问a[5],而是仅仅根据数组元素的类型来确定其值。所以这里使用a[5]并不会出错。

sizeof(&a[0])的值在32 位系下为4，这很好理解。取元素a[0]的首地址。
sizeof(&a)的值在32 位系统下也为4，这也很好理解。取数组a 的首地址。但是在VisualC++6.0 上，这个值为20，我认为是错误的。

二、省政府和市政的区别----&a[0]和&a 的区别

这里&a[0]和&a 到底有什么区别呢？a[0]是一个元素，a 是整个数组，虽然&a[0]和&a的值一样，但其意义不一样。前者是数组首元素的首地址，而后者是数组的首地址。举个例子：湖南的省政府在长沙，而长沙的市政府也在长沙。两个政府都在长沙，但其代表的意义完全不同。这里也是同一个意思。

三、数组名a 作为左值和右值的区别

简单而言，出现在赋值符“=”右边的就是右值，出现在赋值符“=”左边的就是左值。比如,x=y。

左值：在这个上下文环境中，编译器认为x 的含义是x 所代表的地址。这个地址只有编译器知道，在编译的时候确定，编译器在一个特定的区域保存这个地址，我们完全不必考虑这个地址保存在哪里。

右值：在这个上下文环境中，编译器认为y 的含义是y 所代表的地址里面的内容。这个内容是什么，只有到运行时才知道。

C 语言引入一个术语-----“可修改的左值”。意思就是，出现在赋值符左边的符号所代表的地址上的内容一定是可以被修改的。换句话说，就是我们只能给非只读变量赋值。

既然已经明白左值和右值的区别，下面就讨论一下数组作为左值和右值的情况：

当a 作为右值的时候代表的是什么意思呢？很多书认为是数组的首地址，其实这是非常错误的。a 作为右值时其意义与&a[0]是一样，代表的是数组首元素的首地址，而不是数组的首地址。这是两码事。但是注意，这仅仅是代表，并没有一个地方（这只是简单的这么认为，其具体实现细节不作过多讨论）来存储这个地址，也就是说编译器并没有为数组a分配一块内存来存其地址，这一点就与指针有很大的差别。

a 作为右值，我们清楚了其含义，那作为左值呢？

a 不能作为左值！这个错误几乎每一个学生都犯过。编译器会认为数组名作为左值代表的意思是a 的首元素的首地址，但是这个地址开始的一块内存是一个总体，我们只能访问数组的某个元素而无法把数组当一个总体进行访问。所以我们可以把a[i]当左值，而无法把a当左值。其实我们完全可以把a 当一个普通的变量来看，只不过这个变量内部分为很多小块，我们只能通过分别访问这些小块来达到访问整个变量a 的目的。

C语言指针与数组的解说

很多初学者弄不清指针和数组到底有什么样的关系。我现在就告诉你：他们之间没有任何关系！只是他们经常穿着相似的衣服来逗你玩罢了。

指针就是指针，指针变量在32 位系统下，永远占4 个byte，其值为某一个内存的地址。指针可以指向任何地方，但是不是任何地方你都能通过这个指针变量访问到。

数组就是数组，其大小与元素的类型和个数有关。定义数组时必须指定其元素的类型和个数。数组可以存任何类型的数据，但不能存函数。

既然它们之间没有任何关系，那为何很多人把数组和指针混淆呢？甚至很多人认为指针和数组是一样的。这其实只是我们一厢情愿的把他们硬拉到一起罢了

一、以指针的形式访问和以下标的形式访问

下面我们就详细讨论讨论它们之间似是而非的一些特点。例如，函数内部有如下定义：

char *p = “abcdef”;

char a[] = “123456”;

1、以指针的形式访问和以下标的形式访问指针

例子A)定义了一个指针变量p，p 本身在栈上占4 个byte，p 里存储的是一块内存的首地址。这块内存在静态区，其空间大小为7 个byte，这块内存也没有名字。对这块内存的访问完全是匿名的访问。比如现在需要读取字符‘e’，我们有两种方式：

1）以指针的形式：*(p+4)。先取出p 里存储的地址值，假设为0x0000FF00，然后加上4 个字符的偏移量，得到新的地址0x0000FF04。然后取出0x0000FF04 地址上的值。

2）以下标的形式：p[4]。编译器总是把以下标的形式的操作解析为以指针的形式的操作。p[4]这个操作会被解析成：先取出p 里存储的地址值，然后加上中括号中4 个元素的偏移量，计算出新的地址，然后从新的地址中取出值。也就是说以下标的形式访问在本质上与以指针的形式访问没有区别，只是写法上不同罢了。

2、以指针的形式访问和以下标的形式访问数组

例子B)定义了一个数组a，a 拥有7 个char 类型的元素，其空间大小为7。数组a 本身在栈上面。对a 的元素的访问必须先根据数组的名字a 找到数组首元素的首地址，然后根据偏移量找到相应的值。这是一种典型的“具名+匿名”访问。比如现在需要读取字符‘5’，我们有两种方式：

1）以指针的形式：*(a+4)。a 这时候代表的是数组首元素的首地址，假设为0x0000FF00，然后加上4 个字符的偏移量，得到新的地址0x0000FF04。然后取出0x0000FF04 地址上的值。

2）以下标的形式：a[4]。编译器总是把以下标的形式的操作解析为以指针的形式的操作。a[4]这个操作会被解析成：a 作为数组首元素的首地址，然后加上中括号中4 个元素的偏移量，计算出新的地址，然后从新的地址中取出值。
由上面的分析，我们可以看到，指针和数组根本就是两个完全不一样的东西。只是它们都可以“以指针形式”或“以下标形式”进行访问。一个是完全的匿名访问，一个是典型的具名+匿名访问。一定要注意的是这个“以XXX 的形式的访问”这种表达方式。

另外一个需要强调的是：上面所说的偏移量4 代表的是4 个元素，而不是4 个byte。只不过这里刚好是char 类型数据1 个字符的大小就为1 个byte。记住这个偏移量的单位是元素的个数而不是byte 数，在计算新地址时千万别弄错了。

二、a 和&a 的区别

通过上面的分析，相信你已经明白数组和指针的访问方式了，下面再看这个例子：

main()
{
int a[5]={1,2,3,4,5};
int ptr=(int )(&a+1);
printf("%d,%d",(a+1),(ptr-1));
}
打印出来的值为多少呢? 这里主要是考查关于指针加减操作的理解。
对指针进行加1 操作，得到的是下一个元素的地址，而不是原有地址值直接加1。所以，一个类型为T 的指针的移动，以sizeof(T) 为移动单位。因此，对上题来说，a 是一个一维数组，数组中有5 个元素； ptr 是一个int 型的指针。

&a + 1: 取数组a 的首地址，该地址的值加上sizeof(a) 的值，即&a + 5*sizeof(int)，也就是下一个数组的首地址，显然当前指针已经越过了数组的界限。

(int *)(&a+1): 则是把上一步计算出来的地址，强制转换为int * 类型，赋值给ptr。

(a+1): a,&a 的值是一样的，但意思不一样，a 是数组首元素的首地址，也就是a[0]的首地址，&a 是数组的首地址，a+1 是数组下一元素的首地址，即a[1]的首地址,&a+1 是下一个数组的首地址。所以输出2(ptr-1): 因为ptr 是指向a[5]，并且ptr 是int * 类型，所以*(ptr-1) 是指向a[4] ，输出5。

就先到这里，O(∩_∩)O~

我的专栏地址：http://blog.csdn.net/column/details/c-daily-study.html

待续。。。。。。

作者：Ela–学海无涯
来源：CSDN
原文：https://blog.csdn.net/xinyuwuxian/article/details/9041613
版权声明：本文为博主原创文章，转载请附上博文链接！

Daily-C-Study(23)：C语言数组应用

待续。。。。。。

猜你喜欢