Cocoa多线程编程之 block 与 dispatch quene

block 是 Apple 在 GCC 4.2 中扩充的新语法特性,其目的是支持多核并行编程。我们可以将 dispatch_queue 与 block 结合起来使用,方便进行多线程编程。
 

1,实验工程准备
在 XCode 4.0 中,我们建立一个 Mac OS X Application 类型的 Command Line Tool,在 Type 里面我们选择 Foundation 就好,工程名字暂且为 StudyBlocks.默认生成的工程代码 main.m 内容如下:
int  main ( int  argc,  const   char   *  argv[])
{
    NSAutoreleasePool 
*  pool  =  [[NSAutoreleasePool alloc] init];

    
//  insert code here
    NSLog( @" Hello, World! " );

    [pool drain];
    
return   0 ;
}


2,如何编写 block
在自动生成的工程代码中,默认打印一条语句"Hello, World!",这个任务可以不可以用 block 语法来实现呢?答案是肯定的,请看:
     void  ( ^ aBlock)( void =   ^ ( void ){ NSLog( @" Hello, World! " ); };
    aBlock();

用上面的这两行语句替换 main.m 中的 NSLog(@"Hello, World!"); 语句,编译运行,结果是一样的。
 
这两行语句是什么意思呢?首先,等号左边的 void (^aBlock)(void) 表示声明了一个 block,这个 block 不带参数(void)且也无返回参数(void);等号右边的 ^(void){ } 结构表示一个 block 的实现体,至于这个 block 具体要做的事情就都在 {} 之间了。在这里我们仅仅是打印一条语句。整个语句就是声明一个 block,并对其赋值。第二个语句就是调用这个 block 做实际的事情,就像我们调用函数一样。block 很有点像 C++0X 中的 Lambda 表达式。
 
我们也可以这么写:
     void  ( ^ aBlock)( void =   0 ;
    aBlock 
=   ^ ( void ) {
        NSLog(
@" Hello, World! " );
    };

    aBlock();

现在我们知道了一个 block 该如何编写了,那么 block 数组呢?也很简单,请看:
     void  ( ^ blocks[ 2 ])( void =  {
        
^ ( void ){ NSLog( @"  >> This is block 1! " ); },
        
^ ( void ){ NSLog( @"  >> This is block 2! " ); }
    };
    
    blocks[
0 ]();
    blocks[
1 ]();


谨记!
block 是分配在 stack 上的,这意味着我们必须小心里处理 block 的生命周期。
比如如下的做法是不对的,因为 stack 分配的 block 在 if 或 else 内是有效的,但是到大括号 } 退出时就可能无效了:
   dispatch_block_t block;
  
   
if  (x) {
       block 
=   ^ { printf( " true\n " ); };
   } 
else  {
       block 
=   ^ { printf( " false\n " ); };
   }
   block();

上面的代码就相当于下面这样的 unsafe 代码:
    if  (x) {
       
struct  Block __tmp_1  =   //  setup details
       block  =   & __tmp_1;
   } 
else  {
       
struct  Block __tmp_2  =   //  setup details
       block  =   & __tmp_2;
   }


3,如何在 block 中修改外部变量
考虑到 block 的目的是为了支持并行编程,对于普通的 local 变量,我们就不能在 block 里面随意修改(原因很简单,block 可以被多个线程并行运行,会有问题的),而且如果你在 block 中修改普通的 local 变量,编译器也会报错。那么该如何修改外部变量呢?有两种办法,第一种是可以修改 static 全局变量;第二种是可以修改用新关键字 __block 修饰的变量。请看:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    __block 
int  blockLocal   =   100 ;
    
static   int  staticLocal   =   100 ;
    
    
void  ( ^ aBlock)( void =   ^ ( void ){ 
        NSLog(
@"  >> Sum: %d\n " , global  +  staticLocal);
        
        global
++ ;
        blockLocal
++ ;
        staticLocal
++ ;
    };
    
    aBlock();

    NSLog(
@" After modified, global: %d, block local: %d, static local: %d\n " , global, blockLocal, staticLocal);

    [pool drain];

执行之后,值均为:101

相似的情况,我们也可以引用 static block 或 __block block。比如我们可以用他们来实现 block 递归:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    
//  1
     void  ( ^ aBlock)( int =   0 ;
    
static   void  ( ^   const  staticBlock)( int =   ^ ( int  i) {
        
if  (i  >   0 ) {
            NSLog(
@"  >> static %d " , i);
            staticBlock(i 
-   1 );
        }
    };
    
    aBlock 
=  staticBlock;
    aBlock(
5 );
    
    
//  2
    __block  void  ( ^ blockBlock)( int );
    blockBlock 
=   ^ ( int  i) {
        
if  (i  >   0 ) {
            NSLog(
@"  >> block %d " , i);
            blockBlock(i 
-   1 );
        }
    };
    
    blockBlock(
5 );
    
    [pool drain];


4,上面我们介绍了 block 及其基本用法,但还没有涉及并行编程。 block 与 Dispatch Queue 分发队列结合起来使用,是 iOS 中并行编程的利器。请看代码:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    initData();
    
    
//  create dispatch queue
    
//
    dispatch_queue_t queue  =  dispatch_queue_create( " StudyBlocks " , NULL);
    
    dispatch_async(queue, 
^ ( void ) {
        
int  sum  =   0 ;
        
for ( int  i  =   0 ; i  <  Length; i ++ )
            sum 
+=  data[i];
        
        NSLog(
@"  >> Sum: %d " , sum);
        
        flag 
=  YES;
    });
    
    
//  wait util work is done.
    
//
     while  ( ! flag);
    dispatch_release(queue);
    
    [pool drain];


上面的 block 仅仅是将数组求和。首先,我们创建一个 串行分发队列,然后将一个 block 任务加入到其中 并行运行,这样 block 就会在新的线程中运行,直到结束返回主线程。在这里要注意 flag 的使用。flag 是 static 的,所以我们可以 block 中修改它。 语句 while (!flag); 的目的是保证主线程不会 blcok 所在线程之前结束。
 
dispatch_queue_t 的定义如下:
typedef void (^dispatch_block_t)( void);
这意味着加入 dispatch_queue 中的 block 必须是 无参数也无返回值的。

dispatch_queue_create 的定义如下:
dispatch_queue_t dispatch_queue_create(const char *label, dispatch_queue_attr_t attr);
这个函数带有两个参数:一个用于标识 dispatch_queue 的字符串;一个是保留的 dispatch_queue 属性,将其设置为 NULL 即可。
 

我们也可以使用
dispatch_queue_t dispatch_get_global_queue(long priority, unsigned long flags);
来获得全局的 dispatch_queue,参数 priority 表示优先级,值得注意的是:我们不能修改该函数返回的 dispatch_queue。
 
dispatch_async 函数的定义如下:
void dispatch_async(dispatch_queue_t queue, dispatch_block_t block);
它是将一个 block 加入一个 dispatch_queue,这个 block 会再其后得到调度时,并行运行。
 
相应的 dispatch_sync 函数就是 同步执行了,一般很少用到。比如上面的代码如果我们修改为 dispatch_sync,那么就无需编写 flag 同步代码了。

5,dispatch_queue 的运作机制及线程间同步
我们可以将许多 blocks 用 dispatch_async 函数提交到到 dispatch_queue 串行运行。这些 blocks 是按照 FIFO(先入先出)规则调度的,也就是说,先加入的先执行,后加入的一定后执行,但在某一个时刻,可能有多个 block 同时在执行。
 
在上面的例子中,我们的主线程一直在轮询 flag 以便知晓 block 线程是否执行完毕,这样做的效率是很低的,严重浪费 CPU 资源。我们可以使用一些通信机制来解决这个问题,如:semaphore(信号量)。 semaphore 的原理很简单,就是生产-消费模式,必须生产一些资源才能消费,没有资源的时候,那我就啥也不干,直到资源就绪。

下面来看代码:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    initData();
    
    
//  Create a semaphore with 0 resource
    
//
    __block dispatch_semaphore_t sem  =  dispatch_semaphore_create( 0 );
    
    
//  create dispatch semaphore
    
//
    dispatch_queue_t queue  =  dispatch_queue_create( " StudyBlocks " , NULL);
    
    dispatch_async(queue, 
^ ( void ) {
        
int  sum  =   0 ;
        
for ( int  i  =   0 ; i  <  Length; i ++ )
            sum 
+=  data[i];
        
        NSLog(
@"  >> Sum: %d " , sum);
        
        
//  signal the semaphore: add 1 resource
        
//
        dispatch_semaphore_signal(sem);
    });
    
    
//  wait for the semaphore: wait until resource is ready.
    
//
    dispatch_semaphore_wait(sem, DISPATCH_TIME_FOREVER);
    
    dispatch_release(sem);
    dispatch_release(queue);
    
    [pool drain];

首先我们创建一个 __block semaphore,并将其资源初始值设置为 0 (不能少于 0),在这里表示任务还没有完成,没有资源可用主线程不要做事情。然后在 block 任务完成之后,使用 dispatch_semaphore_signal 增加 semaphore 计数(可理解为资源数),表明任务完成,有资源可用主线程可以做事情了。而主线程中的 dispatch_semaphore_wait 就是减少 semaphore 的计数,如果资源数少于 0,则表明资源还可不得,我得按照FIFO(先等先得)的规则等待资源就绪,一旦资源就绪并且得到调度了,我再执行。
 
6 示例:
下面我们来看一个按照 FIFO 顺序执行并用 semaphore 同步的例子:先将数组求和再依次减去数组。
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    initData();
    
    __block 
int  sum  =   0 ;

    
//  Create a semaphore with 0 resource
    
//
    __block dispatch_semaphore_t sem  =  dispatch_semaphore_create( 0 );
    __block dispatch_semaphore_t taskSem 
=  dispatch_semaphore_create( 0 );
    
    
//  create dispatch semaphore
    
//
    dispatch_queue_t queue  =  dispatch_queue_create( " StudyBlocks " , NULL);
    
    dispatch_block_t task1 
=   ^ ( void ) {
        
int  s  =   0 ;
        
for  ( int  i  =   0 ; i  <  Length; i ++ )
            s 
+=  data[i];
        sum 
=  s;
        
        NSLog(
@"  >> after add: %d " , sum);

        dispatch_semaphore_signal(taskSem);
    };
    
    dispatch_block_t task2 
=   ^ ( void ) {
        dispatch_semaphore_wait(taskSem, DISPATCH_TIME_FOREVER);
        
        
int  s  =  sum;
        
for  ( int  i  =   0 ; i  <  Length; i ++ )
            s 
-=  data[i];
        sum 
=  s;

        NSLog(
@"  >> after subtract: %d " , sum);
        dispatch_semaphore_signal(sem);
    };
    
    dispatch_async(queue, task1);
    dispatch_async(queue, task2);
    
    
//  wait for the semaphore: wait until resource is ready.
    
//
    dispatch_semaphore_wait(sem, DISPATCH_TIME_FOREVER);
    
    dispatch_release(taskSem);
    dispatch_release(sem);
    dispatch_release(queue);
    
    [pool drain];

在上面的代码中,我们利用了 dispatch_queue 的 FIFO 特性,确保 task1 先于 task2 执行,而 task2 必须等待直到 task1 执行完毕才开始干正事,主线程又必须等待 task2 才能干正事。 这样我们就可以保证先求和,再相减,然后再让主线程运行结束这个顺序。
 
7,使用 dispatch_apply 进行并发迭代:
对于上面的求和操作,我们也可以使用 dispatch_apply 来简化代码的编写:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    initData();
    
    dispatch_queue_t queue 
=  dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT,  0 );
    
    __block 
int  sum  =   0 ;
    __block 
int   * pArray  =  data;
    
    
//  iterations
    
//
    dispatch_apply(Length, queue,  ^ (size_t i) {
        sum 
+=  pArray[i];
    });
    
    NSLog(
@"  >> sum: %d " , sum);

    dispatch_release(queue);

    [pool drain];

注意这里使用了全局 dispatch_queue。
 
dispatch_apply 的定义如下:
dispatch_apply(size_t iterations, dispatch_queue_t queue, void (^block)(size_t));
参数 iterations 表示迭代的次数,void (^block)(size_t) 是 block 循环体。这么做与 for 循环相比有什么好处呢?答案是:并行,这里的求和是 并行的,并不是按照顺序依次执行求和的。
 
8, dispatch group
我们可以将完成一组相关任务的 block 添加到一个 dispatch group 中去,这样可以在 group 中所有 block 任务都完成之后,再做其他事情。比如 6 中的示例也可以使用 dispatch group 实现:
    NSAutoreleasePool  *  pool  =  [[NSAutoreleasePool alloc] init];
    
    initData();
    
    __block 
int  sum  =   0 ;
    
    
//  Create a semaphore with 0 resource
    
//
    __block dispatch_semaphore_t taskSem  =  dispatch_semaphore_create( 0 );
    
    
//  create dispatch semaphore
    
//
    dispatch_queue_t queue  =  dispatch_queue_create( " StudyBlocks " , NULL);
    dispatch_group_t group 
=  dispatch_group_create();

    dispatch_block_t task1 
=   ^ ( void ) {
        
int  s  =   0 ;
        
for  ( int  i  =   0 ; i  <  Length; i ++ )
            s 
+=  data[i];
        sum 
=  s;
        
        NSLog(
@"  >> after add: %d " , sum);
        
        dispatch_semaphore_signal(taskSem);
    };
    
    dispatch_block_t task2 
=   ^ ( void ) {
        dispatch_semaphore_wait(taskSem, DISPATCH_TIME_FOREVER);
        
        
int  s  =  sum;
        
for  ( int  i  =   0 ; i  <  Length; i ++ )
            s 
-=  data[i];
        sum 
=  s;
        
        NSLog(
@"  >> after subtract: %d " , sum);
    };
    
    
//  Fork
    dispatch_group_async(group, queue, task1);
    dispatch_group_async(group, queue, task2);
    
    
//  Join
    dispatch_group_wait(group, DISPATCH_TIME_FOREVER);
    
    dispatch_release(taskSem);
    dispatch_release(queue);
    dispatch_release(group);
    
    [pool drain];

在上面的代码中,我们使用 dispatch_group_create 创建一个 dispatch_group_t,然后使用语句:dispatch_group_async(group, queue, task1); 将 block 任务加入队列中,并与组关联,这样我们就可以使用 dispatch_group_wait(group, DISPATCH_TIME_FOREVER); 来等待组中所有的 block 任务完成再继续执行。
 
至此我们了解了 dispatch queue 以及 block 并行编程相关基本知识,开始在项目中运用它们吧。
 
参考资料:
Concurrency Programming Guide:
http://www.cppblog.com/kesalin/archive/2011/08/26/154411.html

猜你喜欢

转载自justsee.iteye.com/blog/1780016