objc里的伪指针TaggedPointer

objc里的伪指针TaggedPointer

如果你看过我前面两篇objc函数枢纽msgSend你印象中的NSString是这样吗,相信已经多次看过它的身影了,到底它是何物何作用,我今日就来揭开谜团。
我之所为称呼它为伪指针,是因为它像幽灵一样,没有肉身(实例)但却在能像objc对象实例那样表现出各种行为。你能猜出下面代码运行的结果吗?

// non-arc
id unknown = (id)0x12345678;
NSLog(@"%@", unknown);
unknown = (id)0xa000000000032312;
NSLog(@"%@", unknown);
NSString* s12 = [NSString stringWithUTF8String:"12"];
NSLog(@"%@", s12);
[s12 isEqualToString:unknown];
NSLog(@"%d", *(int64_t*)&s12 == *(int64_t*)&unknown);

如果我随便编写一个地址0x12345678,然后用这个地址进行objc调用,[(id)0x12345678 retain]。相信大家第一反应是我正在对一个不明白的地址访问,指向这个地址的指针大家叫它野指针,我正在向一个“野指针”操作。

如果我又随便编写一个地址像这们0xa000000000032312,并对这个地址进行objc调用[(id)0xa000000000032312 retain]。相信大家的反应是和上面举例的情况一样,尽管当中有人看过我们前面的文章知道这是一个TaggedPointer,但是我还是在对一个不可信的地址进行操作,当访问0xa000000000032312内存地址的内容时将要出错。

但结果却是,0xa000000000032312地址的操作合法,并且用NSLog(@"%@", (id)0xa000000000032312)还打印出12。

大家都熟悉实例的构建过程,如[[NSString alloc] init]和[NSString string]。都必须为对像实例分配空间然后初始化。然而地址0xa000000000032312只是我随便编造的,完全没有在那个地址上分配过空间。
我再来调用[NSString stringWithUTF8String:"12"],返回了一个类型是NSTaggedPointerString实例的指针。指向的地址正是0xa000000000032312。直到这时0xa000000000032312的实例才被构建,然而对这个地址一访问还是一个非法地址。

所以TaggedPointer只是一个伪指针,它的真相就在这个指针指向的地址的数值本身。
0xa000000000032312这个数值就像一个被压缩的对像实例一样,最高4位是isa的线索,参考前面介绍反汇编msgSend文章,最低8位是info信息,中间第9位起的48位是对像的content。用这副幽灵镜来再看0xa000000000032312,什么都一清二楚了,{isa=0xa,coutent='x31x32',len=2}。这是NSString中一种名为EightBitsEncoding的情况。

为什么要有TaggedPointer,就让我们来看一下性能。
用profile分别查看循环100M次的[@"ab" stringAppendByString:@"c"]和[NSString stringWithUTF8String:"abc"];
上一篇的例子可以找到[@"ab" stringAppendByString:@"c"]返回__NSCFString, [NSString stringWithUTF8String:"abc"]返回NSTaggedPointerString。
究竟它们之间有什么样的性能差别呢?由于我的机器性能有限,profile时几近运行不过来,所以没有图可截贴出,只能陈述一下情况。先是[@"ab" stringAppendByString:@"c"]返回__NSCFString的情况,CFString不断地在缓慢分配,待到分配了1M个时,内存占用了50M,机器在profile运行中惨不忍睹,我果断中止了。另一方面[NSString stringWithUTF8String:"abc"]返回NSTaggedPointerString的profile中,CFString数量没有增长,内存自然也没有消耗。好我将循环次数减少至1M次,不做profile,直接运行对比,NSTaggedPointerString的情况明显要快出几倍,因为根本没有构建过实例(,用于返回的实例,中间里面的过程一样还有其它临时实例的)。

除了NSTaggedPointerString还有其它的TaggedPointer,你知道0xb0000000000000c2是什么吗,赶紧试一试。

最后多谢大家再次观看。