引言
苹果为了节省内存和提高执行效率,苹果提出了Tagged Pointer
的概念。对于 64 位程序,引入 Tagged Pointer 后,相关逻辑能减少一半的内存占用,以及 3 倍的访问速度提升,100 倍的创建、销毁速度提升。本文从Tagged Pointer
试图解决的问题入手,理解Tagged Pointer
的实现细节和优势,以及使用时的注意事项。
问题
我们先看看原有的对象为什么会浪费内存。假设我们要存储一个 NSNumber 对象,其值是一个整数。正常情况下,如果这个整数只是一个 NSInteger 的普通变量,那么它所占用的内存是与 CPU 的位数有关,在 32 位 CPU 下占 4 个字节,在 64 位 CPU 下是占 8 个字节的。而指针类型的大小通常也是与 CPU 位数相关,一个指针所占用的内存在 32 位 CPU 下为 4 个字节,在 64 位 CPU 下也是 8 个字节。
所以一个普通的 iOS 程序,如果没有Tagged Pointer
对象,从 32 位机器迁移到 64 位机器中后,虽然逻辑没有任何变化,但这种 NSNumber、NSDate 一类的对象所占用的内存会翻倍。
我们再来看看效率上的问题,为了存储和访问一个 NSNumber 对象,我们需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期,这些都给程序增加了额外的逻辑,造成运行效率上的损失,但该 NSNumber 对象仅仅是存储了一个NSInteger 的普通变量,这样并不划算。
Tagged Pointer
为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer
对象。由于 NSNumber、NSDate 一类的变量本身的值需要占用的内存大小常常不需要 8 个字节,拿整数来说,4 个字节所能表示的有符号整数就可以达到 20 多亿,对于绝大多数情况都是可以处理的。
所以我们可以将一个对象的指针拆成两部分,一部分直接保存数据,另一部分作为特殊标记,表示这是一个特别的指针,不指向任何一个地址。所以,引入了Tagged Pointer
对象之后,64 位 CPU 下 NSNumber 的内存图变成了以下这样:
示例
NSNumber
NSMutableString *mutStr = [NSMutableString stringWithString:@"1"];
for(int i=0; i<20; i+=1){
NSNumber *number = @([mutStr longLongValue]);
NSLog(@"%@, %p", [number class], number);
[mutStr appendString:@"1"];
}
NSLog:
__NSCFNumber, 0xb000000000000013
__NSCFNumber, 0xb0000000000000b3
__NSCFNumber, 0xb0000000000006f3
__NSCFNumber, 0xb000000000004573
__NSCFNumber, 0xb00000000002b673
__NSCFNumber, 0xb0000000001b2073
__NSCFNumber, 0xb0000000010f4473
__NSCFNumber, 0xb00000000a98ac73
__NSCFNumber, 0xb000000069f6bc73
__NSCFNumber, 0xb000000423a35c73
__NSCFNumber, 0xb000002964619c73
__NSCFNumber, 0xb000019debd01c73
__NSCFNumber, 0xb000102b36211c73
__NSCFNumber, 0xb000a1b01d4b1c73
__NSCFNumber, 0xb00650e124ef1c73
__NSCFNumber, 0xb03f28cb71571c73
__NSCFNumber, 0xb27797f26d671c73
__NSCFNumber, 0x608000037e40
__NSCFNumber, 0x608000037e40
__NSCFNumber, 0x60000003a4c0
可以看到NSNumber的数值是1、11、111、1111...以此递增的,但是指针地址的最低4位一直为3,因此此时指针地址最低4位用于标记NSNumber的类型,3为long、float为4、Int为2、double为5。
而最高4位则一直为“b”,指针地址最高4位用于标记是NSNumber类型。其余56位则用来存储数值本身内容的数值位。
当存储用的数值超过56位存储上限的时候,那么NSNumber才会用真正的64位内存地址存储数值,然后用指针指向该内存地址。
NSString
NSMutableString *mutStr = [NSMutableString stringWithString:@"1"];
for(int i=0; i<20; i+=1){
NSString *str = [NSString stringWithString:mutStr];
NSLog(@"%@, %p", [str class], str);
[mutStr appendString:@"1"];
}
NSLog:
NSTaggedPointerString, 0xa000000000000311
NSTaggedPointerString, 0xa000000000031312
NSTaggedPointerString, 0xa000000003131313
NSTaggedPointerString, 0xa000000313131314
NSTaggedPointerString, 0xa000031313131315
NSTaggedPointerString, 0xa003131313131316
NSTaggedPointerString, 0xa313131313131317
NSTaggedPointerString, 0xa0079e79e79e79e8
NSTaggedPointerString, 0xa1e79e79e79e79e9
NSTaggedPointerString, 0xa03def7bdef7bdea
NSTaggedPointerString, 0xa7bdef7bdef7bdeb
__NSCFString, 0x6080002225e0
__NSCFString, 0x6080002224a0
__NSCFString, 0x6080002224e0
__NSCFString, 0x60800004b1f0
__NSCFString, 0x600000048d90
可以看到NSString也是
1、11、111、1111...以此递增的,而且指针地址的最低4位也一直在递增,因此此时指针地址的最低4位表示字符的length。
而最高4位则一直为“a”,指针地址最高4位用于标记是NSString
类型。其余56位则用来存储数值本身内容的数值位。
这里使用ASCII码进行存储,1的ASCII码为49,转为十六进制为31。(字符串中含有ASCII码中不存在的字符时,就不会使用Tagged Pointer进行存储)。
这里需要注意的是,当字符串长度超过了56位的时候,Tagged Pointer并没有立即用指针转向内存,而是用了一种编码压缩算法,把字符串长度进行压缩存储,当这个算法压缩的数据长度超过56位了才使用指针指向内存,也就是字符串长度超过11时。
特点
我们也可以在 WWDC2013 的《Session 404 Advanced in Objective-C》视频中,看到苹果对于Tagged Pointer
特点的介绍:
Tagged Pointer
专门用来存储小的对象,例如NSNumber
和NSDate、NSString
Tagged Pointer
指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要 malloc 和 free。- 在内存读取上有着 3 倍的效率,创建时比以前快 106 倍。
由此可见,苹果引入Tagged Pointer
,不但减少了 64 位机器下程序的内存占用,还提高了运行效率。完美地解决了小内存对象在存储和访问效率上的问题。
isa 指针
Tagged Pointer
的引入也带来了问题,即Tagged Pointer
因为并不是真正的对象,而是一个伪对象,所以你如果完全把它当成对象来使,可能会让它露马脚。因为Tagged Pointer
是没有isa指针的,所以它不是真正的对象。
因为不是真正的对象,所以如果你直接访问Tagged Pointer
的isa
成员的话,在编译时将会得到警告。
只要避免在代码中直接访问对象的 isa 变量,即可避免这个问题。