理解objc_msgSend的作用

来源 ——《Effective Objective-C 2.0 》Matt Galloway

在对象上调用方法是OC中经常使用的功能。用OC的术语来说,这叫做“传递消息”(pass a message)。消息有“名称”(name)或“选择子”(selector),可以接受参数,而且可能还有返回值。

由于OC是C的超集,所以最好先理解C语言的函数调用方式。C语言使用“静态绑定”(static binding),也就是说,在编译期就能决定运行时所应该调用的函数。以下列代码为例:

如果不考虑“内联”(inline),那么编译器在编译代码的时候就已经知道程序中有printHello与printGoodbye这两个函数了,于是会直接生成调用这些函数的指令。而函数地址实际上是硬编码在指令中的。若是将刚才那段代码写成下面这样,会如何呢?

这时就得使用“动态绑定”(dynamic binding)了,因为所要调用的函数直到运行期才能确定。编译器在这种情况下生成的指令与刚才那个例子不同,在第一个例子中,if与else语句里都有函数调用指令。而在第二个例子中,只有一个函数调用指令,不过待调用的函数地址无法硬编码早指令之中,而是要在运行期读取出来。

在OC中,如果想某个对象传递消息,那就会使用动态绑定机制来决定需要调用的方法。在底层,多有方法都是普通的C语言函数,然而对象收到消息之后,究竟该调用哪个方法则完全于运行期决定,甚至可以在程序运行时改变,这些特性使得OC成为一门真正的动态语言。给对象发送消息,可以这样来写:

在本例中,someObject叫做“接收者”(receiver),messageName叫做“选择子”(selector)。选择子与参数合起来称为“消息”(message)。编译器看到此消息后,将其转换为一条标准的C语言函数调用,所调用的函数是消息传递机制中的核心函数,叫做objc_msgSend, 其“原型”(prototype)如下:

这是个“参数个数可变的函数”(variadic function),能接受两个或两个以上的参数。第一个参数代表接收者,第二个参数代表选择子(SEL 是选择子的类型),后续参数就是消息中的那些参数,其顺序不变。选择子指的是方法的名字。“选择子”与“方法”这两个词经常交替使用。编译器会把刚才那个例子中的消息转化为如下函数:

objc_msgSend函数会依据接收者与选择子的类型来调用适当的方法。为了完成此操作,该方法需要在接收者所属的类中搜寻其“方法列表”(list of method),如果能找到与选择子名称相符的方法,就跳至其实现代码。若是找不到,那就沿着继承体系继续向上查找,等找到合适的方法之后再跳转。如果最终还是找不到相符的方法,那就执行“消息转发”(message forwarding)操作。

这么来说,想调用一个方法似乎需要很多步骤。所幸objc_msgSend会将匹配结果缓存在“快速映射表”(fast map)里面,每个类都有这样一块缓存,若是稍后还向该类发送与选择子相同的消息,那么执行起来就很快了。当然啦,这种“快速执行路径”(fast path)还是不如“静态绑定函数调用操作”(statically bound function call)那样迅速,不过只要把选择子缓存起来了,也就不会慢很多,实际上,消息派发(message dispatch)并非应用程序的瓶颈所在。假如真是个瓶颈的话,那你可以只编写纯C函数,在调用时依据需要,把OC对象的状态传进去。

前面讲的这部分内容只描述了部分消息的调用过程,其他“边界情况”(edge case)则需要交给OC运行环境中的另一些函数来处理:

1.objc_msgSend_stret。如果待发送的消息要返回结构体,那么可交由此函数处理。只有当CPU的寄存器能够容纳得下消息返回类型时,这个函数才能处理此消息。若是返回值无法容纳于CPU寄存器中(比如说返回的结构体太大了),那么就由另一个函数执行派发。此时,那个函数会通过分配在栈上的某个变量来处理消息所返回的结构体。

2.objc_msgSend_fpret。如果消息返回的是浮点数,那么可交由此函数处理。在某些架构的CPU中调用函数时,需要对“浮点数寄存器”(floating-point register)做特殊处理,也就是说,通常所说的objc_msgSend在这种情况下并不适用。这个函数是为了处理x86等架构CPU中某些令人惊讶的奇怪情况。

3.objc_msgSendSuper。如果要给父类发消息,例如[super message:parameter],那么久交由此函数处理。也有另外两个与objc_msgSend_stret和objc_msgSend_fpret等效的函数,用于处理发给super的相应消息。

刚才曾提到,objc_msgSend等函数一旦找到应该调用的方法实现以后,就会“跳转过去”。之所以能这样做,是因为OC对象的每个方法都可以视为简单的C函数,其原型如下:

真正的函数名和上面的可能不太一样,笔者用“类”(class)和“选择子”(selector)来命名是想解释其工作原理。每个类里面都有一张表格,其中的指针都会指向这种函数,而选择子的名称则是查表时所用的“键”。objc_msgSend等函数正式通过这张表格来寻找应该执行的方法并跳至其实现的。请注意,原型的样子和objc_msgSend函数很像。这不是巧合,二十为了利用“尾调用优化”(tail-call optimization)技术,令“跳转方法实现”这一操作变得更简单些。

如果某函数的最后一项操作是调用另外一个函数,那么久可以运用“尾调用优化”技术。编译器会生成调转至另一个函数所需的指令码,而且不会向调用堆栈中突入新的“栈帧”(frame stack)。只有当某函数的最后一个操作仅仅是调用其他函数而不会将其返回值另作他用时,才能执行“尾调用优化”。这项优化对objc_msgSend非常关键,如果不这么做的话,那么每次调用OC的方法之前,都需要为调用objc_msgSend函数准备“栈帧”,大家在“栈踪迹”(stack trace)中可以看到这种“栈帧”。此外,若是不优化,还会过早发生“栈溢出”(stack overflow)现象。

在实际编写OC代码的过程中,大家无须担心这一问题,不过应该了解其底层工作原理。这样的话,你就会明白,在发送消息时,代码究竟是如何执行的,而且也能理解,为何在调试的时候,栈“回溯”(backtrace)信息中总是出现objc_msgSend。

Tips:

1.消息由接收者、选择子以及参数构成。给某个对象“发送消息”(invoke a message)也就相当于在该对象上“调用方法”(call a method)。

2.发给某对象的全部消息都要由“动态消息派发系统”(dynamic message dispatch system)来处理,该系统会查出对应的方法,并执行其代码。



发表评论

电子邮件地址不会被公开。 必填项已用*标注