Block源码解析和深入理解
Block的本质
Block是”带有自动变量值的匿名函数”.
我们通过Clang(LLVM编译器)来将OC的代码转换成C++源码的形式,通过如下命令:
clang -rewrite-objc 源代码文件名
下面,我们要转换的Block语法
1 2 3 4 5 6 7
| int main(int argc, const char * argv[]) { void (^blk)(void) = ^{ printf("Block\n"); }; blk(); return 0; }
|
该源代码通过Clang 可变换为以下形式:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
| __block_impl (block)结构体声明 */ struct __block_impl { void *isa; int Flags; int Reserved; void *FuncPtr; };
__main_block_impl_0 匿名的block 结构体声明和实现 */ struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __main_block_impl_0 结构体构造函数实现 */ __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } };
匿名block 具体的函数实现 */ static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
printf("Block\n"); }
匿名block desc 指针的具体函数实现,对block(__main_block_impl_0) 结构体实例的大小进行初始化 */ static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
把多余的转换去掉,看起来就比较清楚了: 第一部分:block的初始化 __main_block_func_0: 参数一 是block语法转换的C语言函数指针。 __main_block_desc_0_DATA: 参数二 作为静态全局变量初始化的 __main_block_desc_0 结构体实例指针 struct __main_block_impl_0 tmp = __main_block_impl_0(__main_block_func_0, &__main_block_desc_0_DATA); struct __main_block_impl_0 *blk = &tmp; 第二部分: block的执行: blk() 去掉转化部分: (*blk -> imp.FuncPtr)(blk); 这就是简单地使用函数指针调用函数。由Block语法转换的 __main_block_func_0 函数的指针被赋值成员变量FuncPtr中,另外 __main_block_func_0的函数的参数 __cself 指向Block的值,通过源码可以看出 Block 正式作为参数进行传递的。 */ int main(int argc, const char * argv[]) { void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
|
针对源码的解释 大部分在代码中都注释了。需要特别指出的是:
static void __main_block_func_0(struct __main_block_impl_0 *__cself)
中的参数 cself 是指向 main_block_impl_0 的指针,及匿名block 自身。
扩展:该句源码类似如 OC 中的方法消息传递,OC中每个方法都默认带两个参数 一个是指向自身的实例self 一个是该方法的SEL 对象。
例如:
1 2 3
| - (void) method: (int)argc{ NLog(@"%p %d \n",self,arg) }
|
Objective - C 编译器同C++的方法一样,也将该方法作为C语言的函数来处理.源码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
| 方法中 在转换成源码后 自动的添加了self, _cmd两个参数 */ void _I_MyObjct_method_(struct Myobject *self,SEL _cmd, int arg){ NSLog (@"%p %d \n",self,arg); } ```
#### 截获自动变量值(局部变量)
```objc struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; int val; const char *fmt; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _dmy, int _val, const char *_fmt, int flags=0) : dmy(_dmy), val(_val), fmt(_fmt) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { int val = __cself->val; const char *fmt = __cself->fmt;
printf("Block\n .. ,%d %s",dmy,val,fmt); }
static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; int main(int argc, const char * argv[]) { int dmy = 256; int val = 10; const char *fmt = "val = %d \n"; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, val, fmt)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
|
源码解析:block 在调用 外部局部变量的时候 其实是将外部局部变量 copy了一份 使用的 所以在没有任何修饰符的时候是不可以修改外部局部变量的。
__block 说明符
之前的分析中,block 无法改变被截获的自动变量的值。这样极为不便:
解决这个问题有两种方法,
第一种:C 语言中有一个变量,允许block改成值。具体如下:
- 静态变量
- 静态全局变量
全局变量
虽然Block语法的匿名函数部分简单的转换为了C语言函数,但从这个C语言函数中访问静态全局,全局变量并没有任何改变,可直接使用。
但静态变量的情况,转换后的函数原本就设置在含有Block语法的函数外,所以无法从变量作用域访问。
看看这段代码的源码:
int global_val = 1;
static int static_global_val = 2;
int main(int argc, const char * argv[]) {
static int static_val = 3;
void (^blk)(void) = ^{
global_val += 1;
static_global_val += 2;
static_val += 3;
};
blk();
return 0;
}
该源代码中使用了Block 改写静态变量 静态全局变量 全局变量。该源代码转换后如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
| int global_val = 1; //全局变量 static int static_global_val = 2; //静态全局变量 struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; int *static_val;//局部静态变量 ---> 可以看出 跟局部变量不同 这边是接受的指针 __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_static_val, int flags=0) : static_val(_static_val) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { int *static_val = __cself->static_val; // bound by copy // 改代码跟局部变量 相似,实际上改变的是一个 复制后的指针.但该指针最终指向的 还是最初的变量值。 global_val += 1; static_global_val += 2; (*static_val) += 3; } static struct __main_block_desc_0 { size_t reserved; size_t Block_size; } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)}; int main(int argc, const char * argv[]) { static int static_val = 3; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &static_val)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
|
分析该源码:发现无论是全局 还是 静态全局 都可以在Block中直接访问 修改变量值。
然而,静态局部变量,貌似也可以正常访问,其调用原理,跟之前的局部变量的调用相似,唯一的不同是,在Block中调用的是 指向该变量的指针,并且是赋值了一份指针(但还是最终指向原来的变量)。所以我们可以在Block中改变原理变量的值。
这样就有个疑问,我们为什么不使用静态局部变量,来使用去自动变量(局部变量)的访问呢?
原因:在该静态局部变量,有变量作用域,当block超出了该作用域,执行的时候,其内部调用的静态局部变量会被废弃,我们就无法调用到。因此Block中超出变量作用域而存在的变量同静态变量一样,将不能通过指针访问原来的自动变量。
解决Block 中不能保存值这一问题的第二个方法是使用__block
1 2 3 4 5 6 7 8
| int main(int argc, const char * argv[]) { __block int val = 3; void (^blk)(void) = ^{ val = 1; }; blk(); return 0; }
|
将上面代码用 clang 转化后如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
| __block 转化成了结构体 */ struct __Block_byref_val_0 { void *__isa; __Block_byref_val_0 *__forwarding; int __flags; int __size; int val; };
struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __Block_byref_val_0 *val; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_val_0 *_val, int flags=0) : val(_val->__forwarding) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself) { __Block_byref_val_0 *val = __cself->val;
(val->__forwarding->val) = 1; } static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->val, (void*)src->val, 8);}
static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->val, 8);}
static struct __main_block_desc_0 { size_t reserved; size_t Block_size; void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*); void (*dispose)(struct __main_block_impl_0*); } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0}; int main(int argc, const char * argv[]) { __attribute__((__blocks__(byref))) __Block_byref_val_0 val = {(void*)0,(__Block_byref_val_0 *)&val, 0, sizeof(__Block_byref_val_0), 3}; void (*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_val_0 *)&val, 570425344)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); return 0; }
|
源码解析:Block_byref_val_0 结构体实例的成员变量forwarding持有指向该实例自身的指针。通过成员变量__forwarding访问成员变量val。(成员变量val是该实例自身持有的变量,它相当于原自动变量)
如图所示:
Block存储域
Block 是Objective-C对象。上面我们所创建的block类 都为_NSConcreteStackBlock.
由上面我们提到的源码可以知道:
1
| impl.isa = &_NSConcreteStackBlock
|
根据 block 结构体实例的 isa 指针进行分类:
- _NSConcreteStackBlock //不难看出 其存储域在栈上
- _NSConcreteGlobalBlock // 其存储域 在全局
- _NSConcreteMallocBlock // 其存储域 在堆上
详细分类如图所示:
_NSConcreteGlobalBlock: 存在的情况:
- 记述全局变量的地方有Block语法时
- Block语法的表达式中不使用应截获的自动变量时
- 以上情况Block 为 全局类对象。除此之外Block语法生成的Block为栈类对象,
例如(一):
1 2 3 4 5 6 7 8 9
| 在下面的block中由于for循环的值 一直在变 所以Block截获的局部变量一直在变。 */ typedef int (^blk_t)(int); for (int rate = 0;rate < 10; ++rate){ blk_t blk = ^(int count){ return rate * count; } }
|
转化为源码如下:
1 2 3 4 5 6 7 8 9 10 11
| struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; int rate; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _rate, int flags=0) : rate(_rate) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } };
|
由此可见 虽然block 声明在全局中,但由于block初始化的时候调用了局部变量,所以该block创建成栈类型的。
_NSConcreteMallocBlock :存在的情况
在分析之前我们看下之前遗留的问题:
- Block 超出变量作用域可存在的原因
- block变量用结构体成员变量forwarding存在的原因
配置在全局变量上的Block,从变量作用域外也可以通过指针安全的使用。但设置在栈上的Blcok,如果其变量作用域结束,该Block就被废弃,同样的block也配置在栈上,所以其所属的变量作用域结束,则该block变量也会被废弃。
Block提供了将Block和block变量从栈上复制到堆上的方法来解决这个问题
而block 变量用结构体成员变量forwarding可以实现无论block变量配置在栈上还是堆上都能够正确的访问__block变量。
深入理解blocks提供的复制方法究竟是啥?
实际上当ARC有效时,编译器会进行判断自动的将block从栈上复制到堆上
如:
1 2 3 4 5 6
| typedef int (^blk_t)(int); blk_t func (int count){ return ^(int count){ return rate *count; }; }
|
源码转换为:
1 2 3 4 5 6 7 8
| blk_t func (int rate) { blk_t tmp = &__func_block_impl_0( _func_block_func_0,&_func_block_desc_0_DATA,rate ); tmp = objc_retainBlock(tmp); return objc_autoreleaseReturnValue(tmp); }
|
分析源码:从源码来看 在ARC状态下 block复制到堆上 实际上其引用计数增加了。
__block变量的存储域
当block从栈中 复制到堆上时,由于block持有block变量,所以其blcok变量也会从栈中复制到堆上,所以当block超出作用域调用block变量也可以成功。这是和静态局部变量最大的区别。而静态局部变量,在block从栈中复制到堆上时,由于block不持有变量,所以静态局部变量不 会复制到堆上,其作用域没变。故出作用域调用会崩溃。
如图所示:
![](http://7xsugd.com2.z0.glb.clouddn.com/runningyoungBlog/images/block持有.png)
截获对象
下面我们将id对象类型的局部变量 在block中调用。id类型的对象 默认修饰符 都是__strong类型的。
1 2 3 4 5 6 7 8 9 10 11 12 13
| typedef void (^blk_t)(id); blk_t blk; int main(int argc, const char * argv[]) { { id array = [[NSMutableArray alloc]init]; blk = [^(id objc){ [array addObject:objc]; NSLog(@"array count = %ld",[array count]); } copy]; } blk(@"ww"); return 0; }
|
分析 :按理来说 array 对象出了大括号作用域,强引用失效 其对象就会废弃。但改代码运行正常。那么就意味着,array对象出大括号作用域时,没有被废弃 ,仍能正常访问。那么是什么原因呢,我们看下Clang之后的源码.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
| typedef void (*blk_t)(id); blk_t blk;
struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; id array; __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, id _array, int flags=0) : array(_array) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } }; static void __main_block_func_0(struct __main_block_impl_0 *__cself, id objc) { id array = __cself->array;
((void (*)(id, SEL, ObjectType))(void *)objc_msgSend)((id)array, sel_registerName("addObject:"), (id)objc); NSLog((NSString *)&__NSConstantStringImpl__var_folders_0b_9hq6xqxs5gjcxx5j_skhh8n00000gn_T_main_1808b3_mi_0,((NSUInteger (*)(id, SEL))(void *)objc_msgSend)((id)array, sel_registerName("count"))); } 关键方法:该方法 相当于ARC 中的 retain方法,将对象的引用计数加一。但该方法除引用计数加一外,还有一个操作就是将block 从栈上复制到堆上,从而可以出作用域,调用id __strong修饰类型的对象。 */ static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->array, (void*)src->array, 3);}
dispose 相当于ARC 模式下的 release 将对象的引用计数减一。引用计数减一得同时,将堆上的block 废弃掉。 */ static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->array, 3);}
static struct __main_block_desc_0 { size_t reserved; size_t Block_size; void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*); void (*dispose)(struct __main_block_impl_0*); } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0}; int main(int argc, const char * argv[]) { { id array = ((NSMutableArray *(*)(id, SEL))(void *)objc_msgSend)((id)((NSMutableArray *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSMutableArray"), sel_registerName("alloc")), sel_registerName("init")); blk = (blk_t)((id (*)(id, SEL))(void *)objc_msgSend)((id)((void (*)(id))&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, array, 570425344)), sel_registerName("copy")); } ((void (*)(__block_impl *, id))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk, (NSString *)&__NSConstantStringImpl__var_folders_0b_9hq6xqxs5gjcxx5j_skhh8n00000gn_T_main_1808b3_mi_1); return 0; }
|
//从上面的源码可以发现:前提:当block调用copy方法,从栈中复制到对象,当Block调用的局部变量是个id对象的时候,该对象在block中自动的引用计数加一,并且该block持有该对象,也就是说,对象出了作用域也能被调用,知道block 从堆上废弃掉为止。如果block 的最后没有调用copy,那么该对象值,也会随着作用域的结束而被废弃。
总结:
什么时候栈上的Block会复制到堆上呢?
- 调用Block的copy实例方法时。
- Block作为函数返回值返回时。
- 将Block赋值给附有__strong修饰符id类型的类或者Block类型成员变量时。
- 在方法名中含有usingBlock的cocoa框架方法或者GCD的API中传递Block时。
对象和__block的区别?
- 如果调用对象的Block,没有调用Copy 或者不在栈上,那么该对象出作用域就会被释放。
- 如果调用对象的Block,调用了Copy,或者Block在堆上,那么该对象的作用域跟使用__block修饰的变量的作用域一直,都会被Block所持有,并且生命周期,会随着Block的废除,而释放。
因此当Block中使用对象类型的自动变量时,除以下情形外,推荐调用Block的copy实例方法!!
- block作为函数返回值返回时。
- Block赋值给类的附加__strong修饰符的id类型或者Block类型的成员变量时。
- 向方法名中含有usingBlock的Cocoa框架方法或者GCD的API中传递Block时。
__block变量和对象
从前面我们看到__block可以修饰任意类型:
- 当然包括id对象strong类型了,其原理是相同的:
当 block 从栈上复制到 堆上时,block 所修饰的自动变量也会从栈上复制到堆上,使用_Block_objct_assign函数,持有赋值给block变量的对象。当 block 废弃时,block所修饰的自动变量,也会通过函数_Block_objct_dispose ,释放掉__block变量的对象。
- 当weak修饰符修饰时,由于weak修饰的自动变量出作用域后会废弃 自动置nil,所以当block调用的时候,其实是调用的nil对象所以不会崩溃,但取不到值。
- 当block weak 同时修饰自动变量时,还是因为weak(不持有对象)的原因,当 block 从栈上复制到堆上时,block变量复制到堆上的是一个nil值,所以对该变量进行的操作都是无效的。
- 当block 和 unsafeunretained 同时修饰变量时,跟weak不同,当unsafeunretained,所修饰的对象边nil 时 该变量不会自动置nil,而是变成野指针,所以当block 从栈上复制到堆上时,实际上__block变量是一个野指针,所以当调用的时候回出错,导致程序崩溃
- block 和 autoreleasing 修饰跟 上面的unsafeunretained是一样的。
Block 循环引用
存在循环引用的情况:当block对象 作为类的 属性或者成员变量,并且在block初始化的时候,调用了self或者self相关类的成员变量。都会引起引用循环。
解决方法:
- 使用__weak 修饰要截取的自动变量,
- 当在MRC 中时,可以使用__unsafe_unretained(弊端 不会自动置nil 容易出现野指针) 修饰。
- 可以使用block 修饰,前提是 必须 执行block代码块,而且可以适当地在代码块中 手动的把block变量置nil
以下是相关解决方法的实例:
实例一:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57
| typedef void (^blk_t)(void); @interface Myobject : NSObject { blk_t blk_; //成员变量 id _objc;//成员变量 } @end @implementation MyObject - (id)init { self = [super init]; /* 分析改代码会出现两种情况的引用循环: * 一种是:成员变量block 调用 self,self中持有block ,block中也持有self,导致引用循环,解决方法在之前 加入 __weak typeof(self) weakSelf = self; * 第二中,虽然成员变量block没有直接调用self ,但其调用了成员变量_objc,所以也会造成引用循环: 解决方法: __weak id weakObjc = _objc; */ blk_ = ^{ NSLog(@"self = %@, objc = %@",self,_objc); } return self; } ``` 实例二:
``` objc typedef void (^blk_t)(void); @interface Myobject : NSObject { blk_t blk_; //成员变量 } @end @implementation MyObject - (id)init { self = [super init]; /* 此处使用__block修饰变量,是的block 持有__block变量,而__block变量持有MyObject对象,而MyObject持有block对象。出现引用循环: 然而 当 block执行的时候,__block变量废弃,从而消除引用循环 */ __block id temp = self; blk_ = ^{ NSLog(@"self = %@,,self); temp = nil; } return self; } - (void)execBlock { blk_() } int main (){ id o = [[MyObject alloc] init]; [o execBlock];//必须执行 否则导致引用循环 return 0; }
|
总结下block 和 weak 之间的优缺点:
使用__block变量的优点:
使用__block变量的缺点如下: