linux下kernel启动流程

  
        
     版权声明:未经博主允许不得转载,请尊重原创, 谢谢!     https://blog.csdn.net/forever_2015/article/details/52885847    
                          
               
先上总流程图,一图胜千言!


head.S 初始化完成后跳转到 start_kernel 入口:

kernel-3.18/init/main.c:505:asmlinkage __visible void __init start_kernel(void)
      
      

START => 源码分析:

这里要干的事情非常多而复杂,如果需要全部理解整个过程的话需要强大的知识背景做支撑以及对内核有着深入的理解才行,基于学习的循序渐进的考量,这里我们重点关注device driver的启动加载流程机制.


      
      
  1. asmlinkage __visible void __ init start_kernel(void)
  2. {
  3.   char *command_line;
  4.   char *after_dashes;
  5.   / *
  6.   * Need to run as early as possible, to initialize the
  7.   * lockdep hash:
  8.   * /
  9.  
  10. / * 有些体系结构有自己的start_kernel入口,这里保证只初始化一次
  11.    系统哈希表chainhash_table * /
  12.  lockdep_init();
  13.  set_task_stack_end_magic(&init_task);
  14.  
  15. / * 获取当前执行cpu的id * /
  16.  smp_setup_processor_id();
  17.  
  18. / * 对象调试支持初始化 * /
  19.  debug_objects_early_init();
  20.   / *
  21.   * Set up the the initial canary ASAP:
  22.   * /
  23.  
  24. / * 初始化栈canary值,canary值用于防止栈溢出攻击,这里不太明白详细... * /
  25.  boot_init_stack_canary();
  26. / * cgrop :将一组任务在一个或多个子系统中与一组参数关联,机制有点复杂... * /
  27.  cgroup_init_early();
  28.  
  29. / * 关闭中断,因为很多初始化的工作不能被中断 * /
  30.  local_irq_disable();
  31.  early_boot_irqs_disabled = true;
  32. / *
  33. * Interrupts are still disabled. Do necessary setups, then
  34. * enable them
  35. * /
  36. / * 获取当前cpu id,激活之 * /
  37.  boot_cpu_init();
  38.  
  39. / * 高端内存相关,建立内核映射所需的散列表 * /
  40.  page_address_init();
  41.  pr_notice( "%s", linux_banner);
  42.  
  43. / * 体系结构相关初始化,没种体系结构都有特有的初始化入口 * /
  44.  setup_arch(&command_line);
  45.  
  46. / * cpu屏蔽位清零 * /
  47.  mm_init_cpumask(&init_mm);
  48.  
  49. / * 将命令行参数保存到 static_command_line 中 * /
  50.  setup_command_line(command_line);
  51.  
  52.  setup_nr_cpu_ids();
  53.  setup_per_cpu_areas();
  54.  smp_prepare_boot_cpu();  / * arch-specific boot-cpu hooks * /
  55. / * 建立系统内存页区(zone)链表 * /
  56.  build_all_zonelists( NULL, NULL);
  57.  
  58. / * cpu热拔插相关, 这名字取得... * /
  59.  page_alloc_init();
  60.  pr_notice( "Kernel command line: %s\n", boot_command_line);
  61.  
  62. / * 解析启动命令行参数 * /
  63.  parse_early_param();
  64.  after_dashes = parse_args( "Booting kernel",
  65.       static_command_line, __start___param,
  66.       __stop___param - __start___param,
  67.       -1, -1, &unknown_bootoption);
  68.   if (!IS_ERR_OR_NULL(after_dashes))
  69.   parse_args( "Setting init args", after_dashes, NULL, 0, -1, -1,
  70.       set_init_arg);
  71. / * 执行跳转指令? * /
  72.  jump_label_init();
  73.   / *
  74.   * These use large bootmem allocations and must precede
  75.   * kmem_cache_init()
  76.   * /
  77.  
  78. / * 设置 log输出缓冲buf * /
  79.  setup_log_buf( 0);
  80.  
  81. / * 初始化和分配pid散列表 * /
  82.  pidhash_init();
  83. / * 创建虚拟文件系统(vfs)需要各种数据结构的缓存 * /
  84.  vfs_caches_init_early();
  85.  
  86. / * 内核异常表排序 * /
  87.  sort_main_extable();
  88.  
  89. / * 异常捕获设置初始化,跟体系结构相关,arm架构的实现是空函数 * /
  90.  trap_init();
  91.  
  92. / * 内核内存分配器初始化,初始化slab机制分配器和vmalloc机制 * /
  93.  mm_init();
  94.   / *
  95.   * Set up the scheduler prior starting any interrupts (such as the
  96.   * timer interrupt). Full topology setup happens at smp_init()
  97.   * time - but meanwhile we still have a functioning scheduler.
  98.   * /
  99.  
  100. / * 调度器数据结构初始化 * /
  101.  sched_init();
  102.   / *
  103.   * Disable preemption - early bootup scheduling is extremely
  104.   * fragile until we cpu_idle() for the first time.
  105.   * /
  106.  
  107. / * 关抢断和中断,启动期间不允许调度和中断 * /
  108.  preempt_disable();
  109.   if (WARN(!irqs_disabled(),
  110.    "Interrupts were enabled *very* early, fixing it\n"))
  111.   local_irq_disable();
  112.   
  113. / * 为 idr(一种将一个整数ID号和一个指针关联在一起的机制) 机制创建cache * /
  114.  idr_init_cache();
  115.  
  116. / * rcu(read-copy-update, 内核锁机制一类)机制初始化 * /
  117.  rcu_init();
  118.  
  119. / * 上下文tracking机制 ? 该机制被 CONFIG_CONTEXT_TRACKING_FORCE 包住了 * /
  120.  context_tracking_init();
  121.  
  122. / * 为内核基数树算法分配内存,运用于内存页查找 * /
  123.  radix_tree_init();
  124.   / * init some links before init_ISA_irqs() * /
  125.  
  126. / * 初始化体系结构相关irq,创建irq描述符,插入到基数属链表 irq_desc_tree 中管理 * /
  127.  early_irq_init();
  128.  init_IRQ();
  129.  
  130. / * 时钟相关初始化 * /
  131.  tick_init();
  132.  rcu_init_nohz();
  133.  init_timers();
  134.  hrtimers_init();
  135.  softirq_init();
  136.  timekeeping_init();
  137.  time_init();
  138.  
  139. / * 进程调度时钟初始化 * /
  140.  sched_clock_postinit();
  141. / * cpu 性能相关monitor * /
  142.  perf_event_init();
  143.  
  144. / * gdb等debug工具设置相关 * /
  145.  profile_init();
  146. / * smp下跨cpu的函数传递初始化 * /
  147.  call_function_init();
  148.  WARN(!irqs_disabled(), "Interrupts were enabled early\n");
  149.  early_boot_irqs_disabled = false;
  150.  
  151. / * 使能中断 * /
  152.  local_irq_enable();
  153. / * slab 分配器后期初始化 * /
  154.  kmem_cache_init_late();
  155.   / *
  156.   * HACK ALERT! This is early. We're enabling the console before
  157.   * we've done PCI setups etc, and console_init() must be aware of
  158.   * this. But we do want output early, in case something goes wrong.
  159.   * /
  160.  
  161. / * 终端控制台输出初始化 * /
  162.  console_init();
  163.  
  164. / * 检查异常记录信息,如果存在异常,走内核panic流程 * /
  165.   if (panic_later)
  166.   panic( "Too many boot %s vars at `%s'", panic_later,
  167.         panic_param);
  168. / * printk 输出相关信息 * /
  169.  lockdep_info();
  170.   / *
  171.   * Need to run this when irqs are enabled, because it wants
  172.   * to self-test [hard/soft]-irqs on/off lock inversion bugs
  173.   * too:
  174.   * /
  175.  
  176. / * 打印测试信息 * /
  177.  locking_selftest();
  178. / * 容器组的页面内存分配 ? * /
  179.  page_cgroup_init();
  180.  page_ext_init();
  181.  
  182. / * debug 相关 * /
  183.  debug_objects_mem_init();
  184.  
  185. / * 内存leak监视 * /
  186.  kmemleak_init();
  187.  setup_per_cpu_pageset();
  188.  numa_policy_init();
  189.   if (late_time_init)
  190.   late_time_init();
  191.  sched_clock_init();
  192.  calibrate_delay();
  193.  
  194. / * 进程pid 映射表初始化 * /
  195.  pidmap_init();
  196.  anon_vma_init();
  197.  acpi_early_init();
  198. / * 创建内核进程分配的cache * /
  199.  thread_info_cache_init();
  200.  cred_init();
  201.  
  202. / * fork 机制初始化 * /
  203.  fork_init(totalram_pages);
  204.  
  205. / * 创建进程需要的slab缓存 * /
  206.  proc_caches_init();
  207.  buffer_init();
  208.  
  209. / * 内核安全架构初始化 * /
  210.  key_init();
  211.  security_init();
  212.  
  213. / * kgdb 在线调试相关支持 * /
  214.  dbg_late_init();
  215.  
  216. / * vfs所需要的slab缓存 * /
  217.  vfs_caches_init(totalram_pages);
  218.  
  219. / * 为 sigqueue_cachep 创建slab缓存 * /
  220.  signals_init();
  221.   / * rootfs populating might need page-writeback * /
  222.  
  223. / * 内存页写回机制初始化 * /
  224.  page_writeback_init();
  225.  
  226. / * proc 文件系统 * /
  227.  proc_root_init();
  228.  
  229.  
  230.  cgroup_init();
  231.  cpuset_init();
  232.  taskstats_init_early();
  233.  delayacct_init();
  234.  check_bugs();
  235.  acpi_subsystem_init();
  236.  sfi_init_late();
  237.   if (efi_enabled(EFI_RUNTIME_SERVICES)) {
  238.   efi_late_init();
  239.   efi_free_boot_services();
  240.  }
  241. / * trace 初始化 * /
  242.  ftrace_init();
  243. / * 创建2号内核线程kthreadd,初始化device driver,拉起1号进程init等 * /
  244.  rest_init();
  245. }

小结:
从上面注释可以看到 start_kernel 函数干的事情非常多(这里不一一罗列了),而且几乎每一个子函数包含的内容都很复杂需要非常深厚的操作系统、计算机结构和数据结构等知识积累才能分析清楚,而这里我们感兴趣和重点关注跟我们实际工作关系最密切的设备驱动的加载过程。

rest_init 分析.


      
      
  1. static noinline void __ init_refok rest_init(void)
  2. {
  3.   int pid;
  4. ...
  5.  
  6.   // 由0号进程fork出1号进程进入kernel_init,拉起第一个用户空间程序init.
  7.  kernel_thread(kernel_init, NULL, CLONE_FS);
  8.  numa_default_policy();
  9.  
  10.   // 创建2号内核线程.
  11.  pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
  12.  rcu_read_lock();
  13.  kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
  14.  rcu_read_unlock();
  15.  
  16.   // 等待kthreadd初始化完成。
  17.  complete(&kthreadd_done);
  18.  init_idle_bootup_task(current);
  19.  schedule_preempt_disabled();
  20.     // 0 号进程最终成为idle运行。
  21.  cpu_startup_entry(CPUHP_ONLINE);
  22. }

      
      
如下图:
内核0号进程fork出1号跟2号进程,1号进程演变成init进程,2号进程就是kthread进程,后面内核空间所有新进程都由2号进程fork出来。

      
      
用户空间所有新进程都是1号进程的子孙:

      
      
小结:
1、首先0号进程fork出1号init进程,执行设备驱动初始化和拉起第一个用户空间程序init;
2、接着0号进程fork出2号内核线程(kthreadd)作为内核的守护进程;
3、然后0号进程进入idle循环.

      
      
  1. static int __ ref kernel_init(void *unused)
  2. {
  3.   int ret;
  4. // 该函数内包含了初始化各种设备驱动程序等操作.
  5.  kernel_init_freeable();
  6. ...
  7.   if (execute_command) {
  8.   ret = run_init_process(execute_command);
  9.    if (!ret)
  10.     return 0;
  11.   pr_err( "Failed to execute %s (error %d).  Attempting defaults...\n",
  12.    execute_command, ret);
  13.  }
  14.  
  15. // 依次找然后执行init程序.
  16.   if (!try_to_run_init_process( "/sbin/init") ||
  17.      !try_to_run_init_process( "/etc/init") ||
  18.      !try_to_run_init_process( "/bin/init") ||
  19.      !try_to_run_init_process( "/bin/sh"))
  20.    return 0;
  21. // 如果从上面路径都没有找到init程序就直接kernel panic了.
  22.  panic( "No working init found.  Try passing init= option to kernel. "
  23.        "See Linux Documentation/init.txt for guidance.");
  24. }

      
      
  1. static noinline void __init kernel_init_freeable(void)
  2. {
  3.   /*
  4.   * 这里需要等kthreadd初始化完成才可以继续干活,否则会报内核 Oops.
  5.   */
  6.  wait_for_completion(&kthreadd_done);
  7. ...
  8.     // 进入各种基础初始化
  9.  do_basic_setup();
  10. ...
  11. }

      
      
  1. static void __init do_basic_setup (void)
  2. {
  3.   cpuset_init_smp();
  4.   usermodehelper_init();
  5.   shmem_init();
  6. // 驱动数据结构初始化申请内存,注册内核对象
  7.   driver_init();
  8.   init_irq_proc();
  9.   do_ctors();
  10.   usermodehelper_enable();
  11. // 执行设备驱动入口回调
  12.   do_initcalls();
  13.   random_int_secret_init();
  14. }

      
      
  1. // 依次遍历各个levnel的驱动程序,level越小越先执行。
  2. static void __ init do_initcalls(void)
  3. {
  4.   int level;
  5.   for (level = 0; level < ARRAY_SIZE(initcall_levels) - 1; level++)
  6.   do_initcall_level(level);
  7. }

下面的 do_inicall_level 函数很有趣也比较关键, 我们知道,设备驱动入口都是类似这样写的:module_init(fn),而这个module_init宏 其实就是这里的level 6, 以此为例,内核机制和 编译系统 机制提供实现将这个函数指针fn加到kernel内存布局的  ".init.data" section(段)地址空间中并依次增长,直到添加完所有同level的的设备入口fn到该内存段中,然后再下一个 level的操作...这里实现机制涉及到kernel内存布局相关, 需要参考vmlinux.ld.S文件分析. 所以下面代码中的initcall_levels是一个指针数组, 数组成员也是一个指针数组,数组内容是对应level的函数指针, 所以这里要干的事情就是依次取出各个level的函数指针fn执行(*fn)回调, 也就是实现了依次遍历各个level的驱动程序。


      
      
  1. static void __ init do_initcall_level(int level)
  2. {
  3.   initcall_t *fn;
  4. ...
  5.   /* 依次遍历各个level的驱动程序 */
  6.   for (fn = initcall_levels[level]; fn < initcall_levels[level+ 1]; fn++)
  7.  {
  8.   pr_err( "xxx## %s, %d ,%d: %pf \n", __func__,__LINE__,level, *fn); // 可以验证打印出来看看是什么.
  9.   do_one_initcall(*fn);
  10.  }
  11. }
  12. // 每个数组成员也是一个指针数组,而成员的数组成员是函数指针,__initdata表明了所在的内存段位置.
  13. static initcall_t *initcall_levels[] __initdata = {
  14.  __initcall0_start,
  15.  __initcall1_start,
  16.  __initcall2_start,
  17.  __initcall3_start,
  18.  __initcall4_start,
  19.  __initcall5_start,
  20.  __initcall6_start,
  21.  __initcall7_start,
  22.  __initcall_end,
  23. };

      
      
  1. int __ init_or_module do_one_initcall(initcall_t fn)
  2. {
  3.   int count = preempt_count();
  4.   int ret;
  5.   char msgbuf[ 64];
  6. ...
  7.     // 这个还用的着注释么?.
  8.  ret = fn();
  9. ...
  10.   return ret;
  11. }

验证推测的最好办法就是加log测试,下面是kernel log输出结果,包括fn的函数名和level:


      
      

      
      
  1.         Line 2376: [    0.199826] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: init_mmap_min_addr
  2.  Line 2378: [    0.200871] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: mtk_arch_reset_init
  3.  Line 2386: [    0.204162] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: init_cpufreq_transition_notifier_list
  4.  Line 2388: [    0.205416] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: net_ns_init
  5.  Line 2390: [    0.206843] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,1: vfp_init
  6.  Line 2398: [    0.209921] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,1: ptrace_break_init
  7. ...
  8.  Line 2468: [    0.264062] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,2: atomic_pool_init
  9.  Line 2472: [    0.266331] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,2: bdi_class_init
  10. ...
  11.  Line 2524: [    0.319510] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,3: gate_vma_init
  12.  Line 2526: [    0.320495] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,3: customize_machine
  13. ...
  14.  Line 3236: [    0.829585] < 0>.( 0)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: proc_schedstat_init
  15.  Line 3238: [    0.830644] < 0>.( 0)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: pm_sysrq_init
  16. ...
  17.  Line 3522: [    1.005405] < 1>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: wireless_nlevent_init
  18.  Line 3524: [    1.008609] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: activity_stats_init
  19. ...
  20.  Line 4136: [    1.542339] < 3>.( 3)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: register_pmu_driver
  21.  Line 4142: [    1.569623] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: kallsyms_init
  22.  Line 4144: [    1.570621] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: audit_init
  23.  ...
  24.  Line 4474: [    1.763312] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: ltr553_init
  25.  Line 4482: [    1.767457] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: epl_sensor_init
  26.  Line 4492: [    1.771665] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: bma222_init
  27.  Line 4498: [    1.774798] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: akm09911_init
  28.  Line 4500: [    1.776511] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: hall_init
  29. ...
  30.  Line 6436: [    2.805940] < 2>.( 3)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,7: init_machine_late
  31. ...

现在我们已经实现了从start_kernel到回调驱动入口代码的流程分析,还有比较关心的就是从kernel_init到具体某一个驱动的probe函数的整个代码流程是怎么样的(深入了解这个流程对于debug有实际意义),  通常做法有两种方式,一种就是继续跟代码,一步一步的看逻辑找答案,另外一种比较简单而实用的方式就是使用调试手段加dump_stack(),把call stack打印出来就清楚明了了, 我们的做法是两者结合,这样是最清楚不过的了。
先来看 简单实用 的方式,下面以  battery_meter_init 代码为例,看从模块入口到probe的代码路径是怎么样的:


      
      
  1. static int battery_meter_probe(struct platform_device *dev)
  2. {
  3.     int ret_device_file = 0;
  4.     char *temp_strptr;
  5.     battery_log(BAT_LOG_CRTI, "------- battery_meter_probe!! -------\n");
  6.     dump_stack();
  7. ...

编译-烧机-抓开机log:


      
      
  1. [    2.322439] <1> .(1)[1:swapper/0]------- battery _meter_ probe!! -------
  2. [     2.323246] <1> -(1)[1:swapper/0]CPU: 1 PID: 1 Comm: swapper/0 Tainted: G        W      3.18.35+ #4
  3. [     2.324357] Backtrace :
  4. [     2.324676 ] <1> -(1)[ 1:swapper/0 ][ <c010badc> ] (dump _backtrace) from [<c010bc7c>] (show_ stack+0x18/0x1c)
  5. [     2.325832]  r6:c103d790 r5:ffffffff r4: 00000000 r3: 00000000
  6. [     2.326547 ] <1> -(1)[ 1:swapper/0 ][ <c010bc64> ] (show _stack) from [<c0a92d58>] ( dump_stack +0x90/0xa4)
  7. [     2.327669 ] <1> -(1)[ 1:swapper/0 ][ <c0a92cc8> ] (dump _stack) from [<c07e1f2c>] ( battery_meter_probe +0x40/0x22c)
  8. [     2.328889]  r8:c1080b7c r7:c1080b7c r6:c044fcfc r5:c12f5318 r4:c1080a38 r3: 00000000
  9. [     2.329866 ] <1> -(1)[ 1:swapper/0 ][ <c07e1eec> ] (battery _meter_ probe) from [ <c03c4354> ] ( platform_drv_probe +0x38/0x90)
  10. [     2.331162]  r7:c1080b7c r6:fffffdfb r5:c1080a48 r4:ffffffed
  11. [     2.331877 ] <1> -(1)[ 1:swapper/0 ][ <c03c431c> ] (platform _drv_ probe) from [ <c03c29e4> ] ( driver_probe_device +0x1d8/0x43c)
  12. [     2.333195]  r7:c115017c r6:c10a7c38 r5:c1080a48 r4:c1150170
  13. [     2.333908 ] <1> -(1)[ 1:swapper/0 ][ <c03c280c> ] (driver _probe_ device) from [ <c03c2c90> ] ( __device_attach +0x48/0x4c)
  14. [     2.335171]  r10: 00000000 r9: 00000000 r8: 00000000 r7: 00000000 r6:c03c2c48 r5:c1080a48
  15. [     2.336147]  r4:c1080b7c
  16. [     2.336470 ] <1> -(1)[ 1:swapper/0 ][ <c03c2c48> ] ( __device_ attach) from [ <c03c129c> ] ( bus_for_each_drv +0x60/0x94)
  17. [     2.337701]  r5:c1080a48 r4: 00000000
  18. [     2.338154 ] <1> -(1)[ 1:swapper/0 ][ <c03c123c> ] (bus _for_ each _drv) from [<c03c2dac>] ( device_attach +0x80/0x88)
  19. [     2.339363]  r6:c1040f40 r5:c1080a7c r4:c1080a48
  20. [     2.339945 ] <1> -(1)[ 1:swapper/0 ][ <c03c2d2c> ] (device _attach) from [<c03c1524>] ( bus_probe_device +0x8c/0xb0)
  21. [     2.341154]  r6:c1040f40 r5:c1080a48 r4:c1080a50 r3:df166000
  22. [     2.341870 ] <1> -(1)[ 1:swapper/0 ][ <c03c1498> ] (bus _probe_ device) from [ <c03bf2a4> ] ( device_add +0x43c/0x558)
  23. [     2.343068]  r6:c1080a48 r5:c1040e40 r4:c1080a50 r3: 00000001
  24. [     2.343784 ] <1> -(1)[ 1:swapper/0 ][ <c03bee68> ] (device _add) from [<c03c4a04>] ( platform_device_add +0xd0/0x264)
  25. [     2.345004]  r9:de089bc0 r8:c1080bd4 r7:c1080bd4 r6:c1080a48 r5:c1080a38 r4: 00000000
  26. [     2.345979 ] <1> -(1)[ 1:swapper/0 ][ <c03c4934> ] (platform _devdev) from [<c03c2dd8>] ( driver_attach +0x24/0x28)
  27. [     2.359715]  r6:c1040f40 r5:de087b80 r4:c1080bd4
  28. [     2.360298 ] <1> -(1)[ 1:swapper/0 ][ <c03c2db4> ] (driver _attach) from [<c03c17f0>] ( bus_add_driver +0x15c/0x218)
  29. [     2.361516 ] <1> -(1)[ 1:swapper/0 ][ <c03c1694> ] (bus _add_ driver) from [ <c03c3750> ] ( driver_register +0x80/0x100)
  30. [     2.362735]  r7:df04a038 r6:c0f39e6c r5: 00000000 r4:c1080bd4
  31. [     2.363450 ] <1> -(1)[ 1:swapper/0 ][ <c03c36d0> ] (driver _register) from [<c03c4e54>] ( __platform_driver_register +0x5c/0x64)
  32. [     2.364789]  r5: 00000000 r4:c12f5318
  33. [     2.365244 ] <1> -(1)[ 1:swapper/0 ][ <c03c4df8> ] ( __platform_ driver _register) from [<c0f39ee0>] ( battery_meter_init +0x74/0xc4)
  34. [     2.366627 ] <1> -(1)[ 1:swapper/0 ][ <c0f39e6c> ] (battery _meter_ init) from [ <c0f00e74> ] ( do_one_initcall +0x140/0x200)
  35. [     2.367901]  r5:c0f62538 r4:c0f62538
  36. [     2.368354 ] <1> -(1)[ 1:swapper/0 ][ <c0f00d34> ] (do _one_ initcall) from [ <c0f010a0> ] ( kernel_init_freeable +0x16c/0x20c)
  37. [     2.369649]  r10:c0f62d6c r9: 00000141 r8:c0f00600 r7:c10efb80 r6:c0f62d60 r5:c0f6c278
  38. [     2.370625]  r4: 00000006
  39. [     2.370951 ] <1> -(1)[ 1:swapper/0 ][ <c0f00f34> ] (kernel _init_ freeable) from [ <c0a8bd78> ] ( kernel_init +0x10/0x100)

从上面 backtrace看整个代码调用流程就很清晰了,所以这种方式其实是非常实用而重要的debug手段!

下面进入源码分析,验证上面的过程:


      
      
  1. static int __init battery_meter_init(void)
  2. {
  3.   int ret;
  4. // 注册到平台设备
  5.   ret = platform_device_register(&battery_meter_device);
  6.   if ( ret) {
  7.    return ret;
  8.  }
  9.  
  10. // 注册到平台驱动
  11.   ret = platform_driver_register(&battery_meter_driver);
  12.   if ( ret) {
  13.    return ret;
  14.  }
  15.   return 0;
  16. }

继续看平台驱动注册:


      
      
  1. // 发现这个其实是一个宏定义
  2. #define platform_driver_register(drv) \
  3.  __platform_driver_register(drv, THIS_MODULE)
  4.  
  5.  
  6. int __platform_driver_register( struct platform_driver *drv,
  7.      struct module *owner)
  8. {
  9. // 标记为:THIS_MODULE
  10.  drv->driver.owner = owner;
  11. // 总线类型
  12.  drv->driver.bus = &platform_bus_type;
  13. // drv->driver 赋值,下面的 platform_drv_probe 其实就是最终需要call的接口!
  14.   if (drv->probe)
  15.   drv->driver.probe = platform_drv_probe;
  16.   if (drv->remove)
  17.   drv->driver.remove = platform_drv_remove;
  18.   if (drv->shutdown)
  19.   drv->driver.shutdown = platform_drv_shutdown;
  20.   return driver_register(&drv->driver);
  21. }
  22.  
  23. int driver_register( struct device_driver *drv)
  24. {
  25.   int ret;
  26.   struct device_driver *other;
  27. // 异常判断,如果依次直接kernel panic.
  28.  BUG_ON(!drv->bus->p);
  29.   if ((drv->bus->probe && drv->probe) ||
  30.      (drv->bus->remove && drv->remove) ||
  31.      (drv->bus->shutdown && drv->shutdown))
  32.   printk(KERN_WARNING "Driver '%s' needs updating - please use "
  33.     "bus_type methods\n", drv->name);
  34. /* 首先去drivers_kset的对象list中查是否存在相同名字的内核对象,如果存在就
  35.    输出错误提示信息。
  36. */
  37.  other = driver_find(drv->name, drv->bus);
  38.   if (other) {
  39.   // 这个log信息可以用于驱动debug检查。
  40.   printk(KERN_ERR "Error: Driver '%s' is already registered, "
  41.     "aborting...\n", drv->name);
  42.    return -EBUSY;
  43.  }
  44. // 如果是新的driver则加入到总线中.
  45.  ret = bus_add_driver(drv);
  46. ...
  47. }

      
      
  1. int bus_add_driver( struct device_driver *drv)
  2. {
  3.   struct bus_type *bus;
  4.   struct driver_private * priv;
  5.   int error = 0;
  6.  bus = bus_get(drv->bus);
  7.   if (!bus)
  8.    return -EINVAL;
  9. // debug辅助信息
  10.  pr_debug( "bus: '%s': add driver %s\n", bus->name, drv->name);
  11. // 使用kmalloc申请内存,初始化为0,属于线性映射内存
  12.   priv = kzalloc( sizeof(* priv), GFP_KERNEL);
  13.   if (! priv) {
  14.   error = -ENOMEM;
  15.    goto out_put_bus;
  16.  }
  17.  
  18. // 注册到driver内核对象链表.
  19.  klist_init(& priv->klist_devices, NULL, NULL);
  20.   priv->driver = drv;
  21.  drv->p = priv;
  22.   priv->kobj.kset = bus->p->drivers_kset;
  23.  error = kobject_init_and_add(& priv->kobj, &driver_ktype, NULL,
  24.          "%s", drv->name);
  25. // 如果注册失败,直接退出.
  26.   if (error)
  27.    goto out_unregister;
  28.   
  29. // 添加到klist_drivers list 中管理.
  30.  klist_add_tail(& priv->knode_bus, &bus->p->klist_drivers);
  31.   if (drv->bus->p->drivers_autoprobe) {
  32.   // attach.
  33.   error = driver_attach(drv);
  34.    if (error)
  35.     goto out_unregister;
  36.  }
  37. ...
  38. }

      
      
  1. int driver_attach(struct device_driver *drv)
  2. {
  3. /* 通过drv找到dev然后传入__driver_attach执行,这里使用了内核中最
  4.    普遍的获取容器数据结构实例的指针操作.
  5. */
  6.   return bus_for_each_dev(drv->bus, NULL, drv, __driver_attach);
  7. }

      
      
  1. static int __driver_attach(struct device *dev, void * data)
  2. {
  3.  struct device_driver *drv = data;
  4. // 如果dev跟drv不匹配,返回.
  5.   if ( !driver_match_device(drv, dev))
  6.    return 0;
  7. // 如果存在父设备,则需要拿到两把锁
  8.   if (dev -> parent/* Needed for USB */
  9.   device_lock(dev -> parent);
  10.  device_lock(dev);
  11.  
  12. // 匹配到,执行driver的probe
  13.   if ( !dev ->driver)
  14.   driver_probe_device(drv, dev);
  15.   
  16. // 执行完释放锁.
  17.  device_unlock(dev);
  18.   if (dev -> parent)
  19.   device_unlock(dev -> parent);
  20.   return 0;
  21. }

这里就是关键地方了!


      
      
  1. int driver_probe_device( struct device_driver *drv, struct device *dev)
  2. {
  3.   int ret = 0;
  4. // 如果没注册dev返回错误
  5.   if (!device_is_registered(dev))
  6.    return -ENODEV;
  7. // 有用的debug信息
  8.  pr_debug( "bus: '%s': %s: matched device %s with driver %s\n",
  9.    drv->bus->name, __func__, dev_name(dev), drv->name);
  10. // pm runtime需要保证不挂起.
  11.  pm_runtime_barrier(dev);
  12.  
  13. // 看名字就知道这里就是要干最终的call驱动的probe了?
  14.  ret = really_probe(dev, drv);
  15.  pm_request_idle(dev);
  16.   return ret;
  17. }

      
      
  1. static int really_probe( struct device *dev, struct device_driver *drv)
  2. {
  3.   int ret = 0;
  4.   int local_trigger_count = atomic_read(&deferred_trigger_count);
  5. // 原子计数器,保证原子操作
  6.  atomic_inc(&probe_count);
  7.  
  8. // 有用的debug信息
  9.  pr_debug( "bus: '%s': %s: probing driver %s with device %s\n",
  10.    drv->bus->name, __func__, drv->name, dev_name(dev));
  11.  WARN_ON(!list_empty(&dev->devres_head));
  12.  dev->driver = drv;
  13. ...
  14. // 执行probe:
  15.   if (dev->bus->probe) {
  16.   TIME_LOG_START();
  17.   ret = dev->bus->probe(dev);
  18.   TIME_LOG_END();
  19.   bootprof_probe(ts, dev, drv, (unsigned long)dev->bus->probe);
  20.    if (ret)
  21.     goto probe_failed;
  22.  } else if (drv->probe) {
  23.   TIME_LOG_START();
  24.   
  25.   /* 这里执行最新的probe,这个drv->probe是不是好像哪里见过???
        
     版权声明:未经博主允许不得转载,请尊重原创, 谢谢!     https://blog.csdn.net/forever_2015/article/details/52885847    
                          
               
先上总流程图,一图胜千言!


head.S 初始化完成后跳转到 start_kernel 入口:

kernel-3.18/init/main.c:505:asmlinkage __visible void __init start_kernel(void)
   
   

START => 源码分析:

这里要干的事情非常多而复杂,如果需要全部理解整个过程的话需要强大的知识背景做支撑以及对内核有着深入的理解才行,基于学习的循序渐进的考量,这里我们重点关注device driver的启动加载流程机制.


   
   
  1. asmlinkage __visible void __ init start_kernel(void)
  2. {
  3.   char *command_line;
  4.   char *after_dashes;
  5.   / *
  6.   * Need to run as early as possible, to initialize the
  7.   * lockdep hash:
  8.   * /
  9.  
  10. / * 有些体系结构有自己的start_kernel入口,这里保证只初始化一次
  11.    系统哈希表chainhash_table * /
  12.  lockdep_init();
  13.  set_task_stack_end_magic(&init_task);
  14.  
  15. / * 获取当前执行cpu的id * /
  16.  smp_setup_processor_id();
  17.  
  18. / * 对象调试支持初始化 * /
  19.  debug_objects_early_init();
  20.   / *
  21.   * Set up the the initial canary ASAP:
  22.   * /
  23.  
  24. / * 初始化栈canary值,canary值用于防止栈溢出攻击,这里不太明白详细... * /
  25.  boot_init_stack_canary();
  26. / * cgrop :将一组任务在一个或多个子系统中与一组参数关联,机制有点复杂... * /
  27.  cgroup_init_early();
  28.  
  29. / * 关闭中断,因为很多初始化的工作不能被中断 * /
  30.  local_irq_disable();
  31.  early_boot_irqs_disabled = true;
  32. / *
  33. * Interrupts are still disabled. Do necessary setups, then
  34. * enable them
  35. * /
  36. / * 获取当前cpu id,激活之 * /
  37.  boot_cpu_init();
  38.  
  39. / * 高端内存相关,建立内核映射所需的散列表 * /
  40.  page_address_init();
  41.  pr_notice( "%s", linux_banner);
  42.  
  43. / * 体系结构相关初始化,没种体系结构都有特有的初始化入口 * /
  44.  setup_arch(&command_line);
  45.  
  46. / * cpu屏蔽位清零 * /
  47.  mm_init_cpumask(&init_mm);
  48.  
  49. / * 将命令行参数保存到 static_command_line 中 * /
  50.  setup_command_line(command_line);
  51.  
  52.  setup_nr_cpu_ids();
  53.  setup_per_cpu_areas();
  54.  smp_prepare_boot_cpu();  / * arch-specific boot-cpu hooks * /
  55. / * 建立系统内存页区(zone)链表 * /
  56.  build_all_zonelists( NULL, NULL);
  57.  
  58. / * cpu热拔插相关, 这名字取得... * /
  59.  page_alloc_init();
  60.  pr_notice( "Kernel command line: %s\n", boot_command_line);
  61.  
  62. / * 解析启动命令行参数 * /
  63.  parse_early_param();
  64.  after_dashes = parse_args( "Booting kernel",
  65.       static_command_line, __start___param,
  66.       __stop___param - __start___param,
  67.       -1, -1, &unknown_bootoption);
  68.   if (!IS_ERR_OR_NULL(after_dashes))
  69.   parse_args( "Setting init args", after_dashes, NULL, 0, -1, -1,
  70.       set_init_arg);
  71. / * 执行跳转指令? * /
  72.  jump_label_init();
  73.   / *
  74.   * These use large bootmem allocations and must precede
  75.   * kmem_cache_init()
  76.   * /
  77.  
  78. / * 设置 log输出缓冲buf * /
  79.  setup_log_buf( 0);
  80.  
  81. / * 初始化和分配pid散列表 * /
  82.  pidhash_init();
  83. / * 创建虚拟文件系统(vfs)需要各种数据结构的缓存 * /
  84.  vfs_caches_init_early();
  85.  
  86. / * 内核异常表排序 * /
  87.  sort_main_extable();
  88.  
  89. / * 异常捕获设置初始化,跟体系结构相关,arm架构的实现是空函数 * /
  90.  trap_init();
  91.  
  92. / * 内核内存分配器初始化,初始化slab机制分配器和vmalloc机制 * /
  93.  mm_init();
  94.   / *
  95.   * Set up the scheduler prior starting any interrupts (such as the
  96.   * timer interrupt). Full topology setup happens at smp_init()
  97.   * time - but meanwhile we still have a functioning scheduler.
  98.   * /
  99.  
  100. / * 调度器数据结构初始化 * /
  101.  sched_init();
  102.   / *
  103.   * Disable preemption - early bootup scheduling is extremely
  104.   * fragile until we cpu_idle() for the first time.
  105.   * /
  106.  
  107. / * 关抢断和中断,启动期间不允许调度和中断 * /
  108.  preempt_disable();
  109.   if (WARN(!irqs_disabled(),
  110.    "Interrupts were enabled *very* early, fixing it\n"))
  111.   local_irq_disable();
  112.   
  113. / * 为 idr(一种将一个整数ID号和一个指针关联在一起的机制) 机制创建cache * /
  114.  idr_init_cache();
  115.  
  116. / * rcu(read-copy-update, 内核锁机制一类)机制初始化 * /
  117.  rcu_init();
  118.  
  119. / * 上下文tracking机制 ? 该机制被 CONFIG_CONTEXT_TRACKING_FORCE 包住了 * /
  120.  context_tracking_init();
  121.  
  122. / * 为内核基数树算法分配内存,运用于内存页查找 * /
  123.  radix_tree_init();
  124.   / * init some links before init_ISA_irqs() * /
  125.  
  126. / * 初始化体系结构相关irq,创建irq描述符,插入到基数属链表 irq_desc_tree 中管理 * /
  127.  early_irq_init();
  128.  init_IRQ();
  129.  
  130. / * 时钟相关初始化 * /
  131.  tick_init();
  132.  rcu_init_nohz();
  133.  init_timers();
  134.  hrtimers_init();
  135.  softirq_init();
  136.  timekeeping_init();
  137.  time_init();
  138.  
  139. / * 进程调度时钟初始化 * /
  140.  sched_clock_postinit();
  141. / * cpu 性能相关monitor * /
  142.  perf_event_init();
  143.  
  144. / * gdb等debug工具设置相关 * /
  145.  profile_init();
  146. / * smp下跨cpu的函数传递初始化 * /
  147.  call_function_init();
  148.  WARN(!irqs_disabled(), "Interrupts were enabled early\n");
  149.  early_boot_irqs_disabled = false;
  150.  
  151. / * 使能中断 * /
  152.  local_irq_enable();
  153. / * slab 分配器后期初始化 * /
  154.  kmem_cache_init_late();
  155.   / *
  156.   * HACK ALERT! This is early. We're enabling the console before
  157.   * we've done PCI setups etc, and console_init() must be aware of
  158.   * this. But we do want output early, in case something goes wrong.
  159.   * /
  160.  
  161. / * 终端控制台输出初始化 * /
  162.  console_init();
  163.  
  164. / * 检查异常记录信息,如果存在异常,走内核panic流程 * /
  165.   if (panic_later)
  166.   panic( "Too many boot %s vars at `%s'", panic_later,
  167.         panic_param);
  168. / * printk 输出相关信息 * /
  169.  lockdep_info();
  170.   / *
  171.   * Need to run this when irqs are enabled, because it wants
  172.   * to self-test [hard/soft]-irqs on/off lock inversion bugs
  173.   * too:
  174.   * /
  175.  
  176. / * 打印测试信息 * /
  177.  locking_selftest();
  178. / * 容器组的页面内存分配 ? * /
  179.  page_cgroup_init();
  180.  page_ext_init();
  181.  
  182. / * debug 相关 * /
  183.  debug_objects_mem_init();
  184.  
  185. / * 内存leak监视 * /
  186.  kmemleak_init();
  187.  setup_per_cpu_pageset();
  188.  numa_policy_init();
  189.   if (late_time_init)
  190.   late_time_init();
  191.  sched_clock_init();
  192.  calibrate_delay();
  193.  
  194. / * 进程pid 映射表初始化 * /
  195.  pidmap_init();
  196.  anon_vma_init();
  197.  acpi_early_init();
  198. / * 创建内核进程分配的cache * /
  199.  thread_info_cache_init();
  200.  cred_init();
  201.  
  202. / * fork 机制初始化 * /
  203.  fork_init(totalram_pages);
  204.  
  205. / * 创建进程需要的slab缓存 * /
  206.  proc_caches_init();
  207.  buffer_init();
  208.  
  209. / * 内核安全架构初始化 * /
  210.  key_init();
  211.  security_init();
  212.  
  213. / * kgdb 在线调试相关支持 * /
  214.  dbg_late_init();
  215.  
  216. / * vfs所需要的slab缓存 * /
  217.  vfs_caches_init(totalram_pages);
  218.  
  219. / * 为 sigqueue_cachep 创建slab缓存 * /
  220.  signals_init();
  221.   / * rootfs populating might need page-writeback * /
  222.  
  223. / * 内存页写回机制初始化 * /
  224.  page_writeback_init();
  225.  
  226. / * proc 文件系统 * /
  227.  proc_root_init();
  228.  
  229.  
  230.  cgroup_init();
  231.  cpuset_init();
  232.  taskstats_init_early();
  233.  delayacct_init();
  234.  check_bugs();
  235.  acpi_subsystem_init();
  236.  sfi_init_late();
  237.   if (efi_enabled(EFI_RUNTIME_SERVICES)) {
  238.   efi_late_init();
  239.   efi_free_boot_services();
  240.  }
  241. / * trace 初始化 * /
  242.  ftrace_init();
  243. / * 创建2号内核线程kthreadd,初始化device driver,拉起1号进程init等 * /
  244.  rest_init();
  245. }

小结:
从上面注释可以看到 start_kernel 函数干的事情非常多(这里不一一罗列了),而且几乎每一个子函数包含的内容都很复杂需要非常深厚的操作系统、计算机结构和数据结构等知识积累才能分析清楚,而这里我们感兴趣和重点关注跟我们实际工作关系最密切的设备驱动的加载过程。

rest_init 分析.


   
   
  1. static noinline void __ init_refok rest_init(void)
  2. {
  3.   int pid;
  4. ...
  5.  
  6.   // 由0号进程fork出1号进程进入kernel_init,拉起第一个用户空间程序init.
  7.  kernel_thread(kernel_init, NULL, CLONE_FS);
  8.  numa_default_policy();
  9.  
  10.   // 创建2号内核线程.
  11.  pid = kernel_thread(kthreadd, NULL, CLONE_FS | CLONE_FILES);
  12.  rcu_read_lock();
  13.  kthreadd_task = find_task_by_pid_ns(pid, &init_pid_ns);
  14.  rcu_read_unlock();
  15.  
  16.   // 等待kthreadd初始化完成。
  17.  complete(&kthreadd_done);
  18.  init_idle_bootup_task(current);
  19.  schedule_preempt_disabled();
  20.     // 0 号进程最终成为idle运行。
  21.  cpu_startup_entry(CPUHP_ONLINE);
  22. }

   
   
如下图:
内核0号进程fork出1号跟2号进程,1号进程演变成init进程,2号进程就是kthread进程,后面内核空间所有新进程都由2号进程fork出来。

   
   
用户空间所有新进程都是1号进程的子孙:

   
   
小结:
1、首先0号进程fork出1号init进程,执行设备驱动初始化和拉起第一个用户空间程序init;
2、接着0号进程fork出2号内核线程(kthreadd)作为内核的守护进程;
3、然后0号进程进入idle循环.

   
   
  1. static int __ ref kernel_init(void *unused)
  2. {
  3.   int ret;
  4. // 该函数内包含了初始化各种设备驱动程序等操作.
  5.  kernel_init_freeable();
  6. ...
  7.   if (execute_command) {
  8.   ret = run_init_process(execute_command);
  9.    if (!ret)
  10.     return 0;
  11.   pr_err( "Failed to execute %s (error %d).  Attempting defaults...\n",
  12.    execute_command, ret);
  13.  }
  14.  
  15. // 依次找然后执行init程序.
  16.   if (!try_to_run_init_process( "/sbin/init") ||
  17.      !try_to_run_init_process( "/etc/init") ||
  18.      !try_to_run_init_process( "/bin/init") ||
  19.      !try_to_run_init_process( "/bin/sh"))
  20.    return 0;
  21. // 如果从上面路径都没有找到init程序就直接kernel panic了.
  22.  panic( "No working init found.  Try passing init= option to kernel. "
  23.        "See Linux Documentation/init.txt for guidance.");
  24. }

   
   
  1. static noinline void __init kernel_init_freeable(void)
  2. {
  3.   /*
  4.   * 这里需要等kthreadd初始化完成才可以继续干活,否则会报内核 Oops.
  5.   */
  6.  wait_for_completion(&kthreadd_done);
  7. ...
  8.     // 进入各种基础初始化
  9.  do_basic_setup();
  10. ...
  11. }

   
   
  1. static void __init do_basic_setup (void)
  2. {
  3.   cpuset_init_smp();
  4.   usermodehelper_init();
  5.   shmem_init();
  6. // 驱动数据结构初始化申请内存,注册内核对象
  7.   driver_init();
  8.   init_irq_proc();
  9.   do_ctors();
  10.   usermodehelper_enable();
  11. // 执行设备驱动入口回调
  12.   do_initcalls();
  13.   random_int_secret_init();
  14. }

   
   
  1. // 依次遍历各个levnel的驱动程序,level越小越先执行。
  2. static void __ init do_initcalls(void)
  3. {
  4.   int level;
  5.   for (level = 0; level < ARRAY_SIZE(initcall_levels) - 1; level++)
  6.   do_initcall_level(level);
  7. }

下面的 do_inicall_level 函数很有趣也比较关键, 我们知道,设备驱动入口都是类似这样写的:module_init(fn),而这个module_init宏 其实就是这里的level 6, 以此为例,内核机制和 编译系统 机制提供实现将这个函数指针fn加到kernel内存布局的  ".init.data" section(段)地址空间中并依次增长,直到添加完所有同level的的设备入口fn到该内存段中,然后再下一个 level的操作...这里实现机制涉及到kernel内存布局相关, 需要参考vmlinux.ld.S文件分析. 所以下面代码中的initcall_levels是一个指针数组, 数组成员也是一个指针数组,数组内容是对应level的函数指针, 所以这里要干的事情就是依次取出各个level的函数指针fn执行(*fn)回调, 也就是实现了依次遍历各个level的驱动程序。


   
   
  1. static void __ init do_initcall_level(int level)
  2. {
  3.   initcall_t *fn;
  4. ...
  5.   /* 依次遍历各个level的驱动程序 */
  6.   for (fn = initcall_levels[level]; fn < initcall_levels[level+ 1]; fn++)
  7.  {
  8.   pr_err( "xxx## %s, %d ,%d: %pf \n", __func__,__LINE__,level, *fn); // 可以验证打印出来看看是什么.
  9.   do_one_initcall(*fn);
  10.  }
  11. }
  12. // 每个数组成员也是一个指针数组,而成员的数组成员是函数指针,__initdata表明了所在的内存段位置.
  13. static initcall_t *initcall_levels[] __initdata = {
  14.  __initcall0_start,
  15.  __initcall1_start,
  16.  __initcall2_start,
  17.  __initcall3_start,
  18.  __initcall4_start,
  19.  __initcall5_start,
  20.  __initcall6_start,
  21.  __initcall7_start,
  22.  __initcall_end,
  23. };

   
   
  1. int __ init_or_module do_one_initcall(initcall_t fn)
  2. {
  3.   int count = preempt_count();
  4.   int ret;
  5.   char msgbuf[ 64];
  6. ...
  7.     // 这个还用的着注释么?.
  8.  ret = fn();
  9. ...
  10.   return ret;
  11. }

验证推测的最好办法就是加log测试,下面是kernel log输出结果,包括fn的函数名和level:


   
   

   
   
  1.         Line 2376: [    0.199826] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: init_mmap_min_addr
  2.  Line 2378: [    0.200871] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: mtk_arch_reset_init
  3.  Line 2386: [    0.204162] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: init_cpufreq_transition_notifier_list
  4.  Line 2388: [    0.205416] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,0: net_ns_init
  5.  Line 2390: [    0.206843] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,1: vfp_init
  6.  Line 2398: [    0.209921] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,1: ptrace_break_init
  7. ...
  8.  Line 2468: [    0.264062] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,2: atomic_pool_init
  9.  Line 2472: [    0.266331] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,2: bdi_class_init
  10. ...
  11.  Line 2524: [    0.319510] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,3: gate_vma_init
  12.  Line 2526: [    0.320495] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,3: customize_machine
  13. ...
  14.  Line 3236: [    0.829585] < 0>.( 0)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: proc_schedstat_init
  15.  Line 3238: [    0.830644] < 0>.( 0)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: pm_sysrq_init
  16. ...
  17.  Line 3522: [    1.005405] < 1>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: wireless_nlevent_init
  18.  Line 3524: [    1.008609] < 2>.( 2)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,4: activity_stats_init
  19. ...
  20.  Line 4136: [    1.542339] < 3>.( 3)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: register_pmu_driver
  21.  Line 4142: [    1.569623] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: kallsyms_init
  22.  Line 4144: [    1.570621] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: audit_init
  23.  ...
  24.  Line 4474: [    1.763312] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: ltr553_init
  25.  Line 4482: [    1.767457] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: epl_sensor_init
  26.  Line 4492: [    1.771665] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: bma222_init
  27.  Line 4498: [    1.774798] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: akm09911_init
  28.  Line 4500: [    1.776511] < 1>.( 1)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,6: hall_init
  29. ...
  30.  Line 6436: [    2.805940] < 2>.( 3)[ 1 :swapper/ 0]xxx ## do_initcall_level, 883 ,7: init_machine_late
  31. ...

现在我们已经实现了从start_kernel到回调驱动入口代码的流程分析,还有比较关心的就是从kernel_init到具体某一个驱动的probe函数的整个代码流程是怎么样的(深入了解这个流程对于debug有实际意义),  通常做法有两种方式,一种就是继续跟代码,一步一步的看逻辑找答案,另外一种比较简单而实用的方式就是使用调试手段加dump_stack(),把call stack打印出来就清楚明了了, 我们的做法是两者结合,这样是最清楚不过的了。
先来看 简单实用 的方式,下面以  battery_meter_init 代码为例,看从模块入口到probe的代码路径是怎么样的:


   
   
  1. static int battery_meter_probe(struct platform_device *dev)
  2. {
  3.     int ret_device_file = 0;
  4.     char *temp_strptr;
  5.     battery_log(BAT_LOG_CRTI, "------- battery_meter_probe!! -------\n");
  6.     dump_stack();
  7. ...

编译-烧机-抓开机log:


   
   
  1. [    2.322439] <1> .(1)[1:swapper/0]------- battery _meter_ probe!! -------
  2. [     2.323246] <1> -(1)[1:swapper/0]CPU: 1 PID: 1 Comm: swapper/0 Tainted: G        W      3.18.35+ #4
  3. [     2.324357] Backtrace :
  4. [     2.324676 ] <1> -(1)[ 1:swapper/0 ][ <c010badc> ] (dump _backtrace) from [<c010bc7c>] (show_ stack+0x18/0x1c)
  5. [     2.325832]  r6:c103d790 r5:ffffffff r4: 00000000 r3: 00000000
  6. [     2.326547 ] <1> -(1)[ 1:swapper/0 ][ <c010bc64> ] (show _stack) from [<c0a92d58>] ( dump_stack +0x90/0xa4)
  7. [     2.327669 ] <1> -(1)[ 1:swapper/0 ][ <c0a92cc8> ] (dump _stack) from [<c07e1f2c>] ( battery_meter_probe +0x40/0x22c)
  8. [     2.328889]  r8:c1080b7c r7:c1080b7c r6:c044fcfc r5:c12f5318 r4:c1080a38 r3: 00000000
  9. [     2.329866 ] <1> -(1)[ 1:swapper/0 ][ <c07e1eec> ] (battery _meter_ probe) from [ <c03c4354> ] ( platform_drv_probe +0x38/0x90)
  10. [     2.331162]  r7:c1080b7c r6:fffffdfb r5:c1080a48 r4:ffffffed
  11. [     2.331877 ] <1> -(1)[ 1:swapper/0 ][ <c03c431c> ] (platform _drv_ probe) from [ <c03c29e4> ] ( driver_probe_device +0x1d8/0x43c)
  12. [     2.333195]  r7:c115017c r6:c10a7c38 r5:c1080a48 r4:c1150170
  13. [     2.333908 ] <1> -(1)[ 1:swapper/0 ][ <c03c280c> ] (driver _probe_ device) from [ <c03c2c90> ] ( __device_attach +0x48/0x4c)
  14. [     2.335171]  r10: 00000000 r9: 00000000 r8: 00000000 r7: 00000000 r6:c03c2c48 r5:c1080a48
  15. [     2.336147]  r4:c1080b7c
  16. [     2.336470 ] <1> -(1)[ 1:swapper/0 ][ <c03c2c48> ] ( __device_ attach) from [ <c03c129c> ] ( bus_for_each_drv +0x60/0x94)
  17. [     2.337701]  r5:c1080a48 r4: 00000000
  18. [     2.338154 ] <1> -(1)[ 1:swapper/0 ][ <c03c123c> ] (bus _for_ each _drv) from [<c03c2dac>] ( device_attach +0x80/0x88)
  19. [     2.339363]  r6:c1040f40 r5:c1080a7c r4:c1080a48
  20. [     2.339945 ] <1> -(1)[ 1:swapper/0 ][ <c03c2d2c> ] (device _attach) from [<c03c1524>] ( bus_probe_device +0x8c/0xb0)
  21. [     2.341154]  r6:c1040f40 r5:c1080a48 r4:c1080a50 r3:df166000
  22. [     2.341870 ] <1> -(1)[ 1:swapper/0 ][ <c03c1498> ] (bus _probe_ device) from [ <c03bf2a4> ] ( device_add +0x43c/0x558)
  23. [     2.343068]  r6:c1080a48 r5:c1040e40 r4:c1080a50 r3: 00000001
  24. [     2.343784 ] <1> -(1)[ 1:swapper/0 ][ <c03bee68> ] (device _add) from [<c03c4a04>] ( platform_device_add +0xd0/0x264)
  25. [     2.345004]  r9:de089bc0 r8:c1080bd4 r7:c1080bd4 r6:c1080a48 r5:c1080a38 r4: 00000000
  26. [     2.345979 ] <1> -(1)[ 1:swapper/0 ][ <c03c4934> ] (platform _devdev) from [<c03c2dd8>] ( driver_attach +0x24/0x28)
  27. [     2.359715]  r6:c1040f40 r5:de087b80 r4:c1080bd4
  28. [     2.360298 ] <1> -(1)[ 1:swapper/0 ][ <c03c2db4> ] (driver _attach) from [<c03c17f0>] ( bus_add_driver +0x15c/0x218)
  29. [     2.361516 ] <1> -(1)[ 1:swapper/0 ][ <c03c1694> ] (bus _add_ driver) from [ <c03c3750> ] ( driver_register +0x80/0x100)
  30. [     2.362735]  r7:df04a038 r6:c0f39e6c r5: 00000000 r4:c1080bd4
  31. [     2.363450 ] <1> -(1)[ 1:swapper/0 ][ <c03c36d0> ] (driver _register) from [<c03c4e54>] ( __platform_driver_register +0x5c/0x64)
  32. [     2.364789]  r5: 00000000 r4:c12f5318
  33. [     2.365244 ] <1> -(1)[ 1:swapper/0 ][ <c03c4df8> ] ( __platform_ driver _register) from [<c0f39ee0>] ( battery_meter_init +0x74/0xc4)
  34. [     2.366627 ] <1> -(1)[ 1:swapper/0 ][ <c0f39e6c> ] (battery _meter_ init) from [ <c0f00e74> ] ( do_one_initcall +0x140/0x200)
  35. [     2.367901]  r5:c0f62538 r4:c0f62538
  36. [     2.368354 ] <1> -(1)[ 1:swapper/0 ][ <c0f00d34> ] (do _one_ initcall) from [ <c0f010a0> ] ( kernel_init_freeable +0x16c/0x20c)
  37. [     2.369649]  r10:c0f62d6c r9: 00000141 r8:c0f00600 r7:c10efb80 r6:c0f62d60 r5:c0f6c278
  38. [     2.370625]  r4: 00000006
  39. [     2.370951 ] <1> -(1)[ 1:swapper/0 ][ <c0f00f34> ] (kernel _init_ freeable) from [ <c0a8bd78> ] ( kernel_init +0x10/0x100)

从上面 backtrace看整个代码调用流程就很清晰了,所以这种方式其实是非常实用而重要的debug手段!

下面进入源码分析,验证上面的过程:


   
   
  1. static int __init battery_meter_init(void)
  2. {
  3.   int ret;
  4. // 注册到平台设备
  5.   ret = platform_device_register(&battery_meter_device);
  6.   if ( ret) {
  7.    return ret;
  8.  }
  9.  
  10. // 注册到平台驱动
  11.   ret = platform_driver_register(&battery_meter_driver);
  12.   if ( ret) {
  13.    return ret;
  14.  }
  15.   return 0;
  16. }

继续看平台驱动注册:


   
   
  1. // 发现这个其实是一个宏定义
  2. #define platform_driver_register(drv) \
  3.  __platform_driver_register(drv, THIS_MODULE)
  4.  
  5.  
  6. int __platform_driver_register( struct platform_driver *drv,
  7.      struct module *owner)
  8. {
  9. // 标记为:THIS_MODULE
  10.  drv->driver.owner = owner;
  11. // 总线类型
  12.  drv->driver.bus = &platform_bus_type;
  13. // drv->driver 赋值,下面的 platform_drv_probe 其实就是最终需要call的接口!
  14.   if (drv->probe)
  15.   drv->driver.probe = platform_drv_probe;
  16.   if (drv->remove)
  17.   drv->driver.remove = platform_drv_remove;
  18.   if (drv->shutdown)
  19.   drv->driver.shutdown = platform_drv_shutdown;
  20.   return driver_register(&drv->driver);
  21. }
  22.  
  23. int driver_register( struct device_driver *drv)
  24. {
  25.   int ret;
  26.   struct device_driver *other;
  27. // 异常判断,如果依次直接kernel panic.
  28.  BUG_ON(!drv->bus->p);
  29.   if ((drv->bus->probe && drv->probe) ||
  30.      (drv->bus->remove && drv->remove) ||
  31.      (drv->bus->shutdown && drv->shutdown))
  32.   printk(KERN_WARNING "Driver '%s' needs updating - please use "
  33.     "bus_type methods\n", drv->name);
  34. /* 首先去drivers_kset的对象list中查是否存在相同名字的内核对象,如果存在就
  35.    输出错误提示信息。
  36. */
  37.  other = driver_find(drv->name, drv->bus);
  38.   if (other) {
  39.   // 这个log信息可以用于驱动debug检查。
  40.   printk(KERN_ERR "Error: Driver '%s' is already registered, "
  41.     "aborting...\n", drv->name);
  42.    return -EBUSY;
  43.  }
  44. // 如果是新的driver则加入到总线中.
  45.  ret = bus_add_driver(drv);
  46. ...
  47. }

   
   
  1. int bus_add_driver( struct device_driver *drv)
  2. {
  3.   struct bus_type *bus;
  4.   struct driver_private * priv;
  5.   int error = 0;
  6.  bus = bus_get(drv->bus);
  7.   if (!bus)
  8.    return -EINVAL;
  9. // debug辅助信息
  10.  pr_debug( "bus: '%s': add driver %s\n", bus->name, drv->name);
  11. // 使用kmalloc申请内存,初始化为0,属于线性映射内存
  12.   priv = kzalloc( sizeof(* priv), GFP_KERNEL);
  13.   if (! priv) {
  14.   error = -ENOMEM;
  15.    goto out_put_bus;
  16.  }
  17.  
  18. // 注册到driver内核对象链表.
  19.  klist_init(& priv->klist_devices, NULL, NULL);
  20.   priv->driver = drv;
  21.  drv->p = priv;
  22.   priv->kobj.kset = bus->p->drivers_kset;
  23.  error = kobject_init_and_add(& priv->kobj, &driver_ktype, NULL,
  24.          "%s", drv->name);
  25. // 如果注册失败,直接退出.
  26.   if (error)
  27.    goto out_unregister;
  28.   
  29. // 添加到klist_drivers list 中管理.
  30.  klist_add_tail(& priv->knode_bus, &bus->p->klist_drivers);
  31.   if (drv->bus->p->drivers_autoprobe) {
  32.   // attach.
  33.   error = driver_attach(drv);
  34.    if (error)
  35.     goto out_unregister;
  36.  }
  37. ...
  38. }

   
   
  1. int driver_attach(struct device_driver *drv)
  2. {
  3. /* 通过drv找到dev然后传入__driver_attach执行,这里使用了内核中最
  4.    普遍的获取容器数据结构实例的指针操作.
  5. */
  6.   return bus_for_each_dev(drv->bus, NULL, drv, __driver_attach);
  7. }

   
   
  1. static int __driver_attach(struct device *dev, void * data)
  2. {
  3.  struct device_driver *drv = data;
  4. // 如果dev跟drv不匹配,返回.
  5.   if ( !driver_match_device(drv, dev))
  6.    return 0;
  7. // 如果存在父设备,则需要拿到两把锁
  8.   if (dev -> parent/* Needed for USB */
  9.   device_lock(dev -> parent);
  10.  device_lock(dev);
  11.  
  12. // 匹配到,执行driver的probe
  13.   if ( !dev ->driver)
  14.   driver_probe_device(drv, dev);
  15.   
  16. // 执行完释放锁.
  17.  device_unlock(dev);
  18.   if (dev -> parent)
  19.   device_unlock(dev -> parent);
  20.   return 0;
  21. }

这里就是关键地方了!


   
   
  1. int driver_probe_device( struct device_driver *drv, struct device *dev)
  2. {
  3.   int ret = 0;
  4. // 如果没注册dev返回错误
  5.   if (!device_is_registered(dev))
  6.    return -ENODEV;
  7. // 有用的debug信息
  8.  pr_debug( "bus: '%s': %s: matched device %s with driver %s\n",
  9.    drv->bus->name, __func__, dev_name(dev), drv->name);
  10. // pm runtime需要保证不挂起.
  11.  pm_runtime_barrier(dev);
  12.  
  13. // 看名字就知道这里就是要干最终的call驱动的probe了?
  14.  ret = really_probe(dev, drv);
  15.  pm_request_idle(dev);
  16.   return ret;
  17. }

   
   
  1. static int really_probe( struct device *dev, struct device_driver *drv)
  2. {
  3.   int ret = 0;
  4.   int local_trigger_count = atomic_read(&deferred_trigger_count);
  5. // 原子计数器,保证原子操作
  6.  atomic_inc(&probe_count);
  7.  
  8. // 有用的debug信息
  9.  pr_debug( "bus: '%s': %s: probing driver %s with device %s\n",
  10.    drv->bus->name, __func__, drv->name, dev_name(dev));
  11.  WARN_ON(!list_empty(&dev->devres_head));
  12.  dev->driver = drv;
  13. ...
  14. // 执行probe:
  15.   if (dev->bus->probe) {
  16.   TIME_LOG_START();
  17.   ret = dev->bus->probe(dev);
  18.   TIME_LOG_END();
  19.   bootprof_probe(ts, dev, drv, (unsigned long)dev->bus->probe);
  20.    if (ret)
  21.     goto probe_failed;
  22.  } else if (drv->probe) {
  23.   TIME_LOG_START();
  24.   
  25.   /* 这里执行最新的probe,这个drv->probe是不是好像哪里见过???

猜你喜欢

转载自blog.csdn.net/qq_40788950/article/details/83925304