kallsyms.c 5.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200
  1. /**
  2. * @file kallsyms.c
  3. * @author longjin ([email protected])
  4. * @brief 内核栈跟踪
  5. * @version 0.1
  6. * @date 2022-06-22
  7. *
  8. * @copyright Copyright (c) 2022
  9. *
  10. */
  11. #include <stdint.h>
  12. #include <stdio.h>
  13. #include <stdlib.h>
  14. #include <string.h>
  15. /**
  16. * @brief 判断符号是否需要被输出(只输出text段内的符号)
  17. *
  18. */
  19. #define symbol_to_write(vaddr, tv, etv) \
  20. ((vaddr < tv || vaddr > etv) ? 0 : 1)
  21. /**
  22. * @brief 使用nm命令提取出来的信息存到这个结构体之中
  23. *
  24. */
  25. struct kernel_symbol_entry_t
  26. {
  27. uint64_t vaddr;
  28. char type;
  29. char *symbol;
  30. int symbol_length;
  31. };
  32. struct kernel_symbol_entry_t *symbol_table;
  33. // 符号表最大能容纳的entry数量
  34. uint64_t table_size = 0;
  35. // 符号表当前的entry数量
  36. uint64_t entry_count = 0;
  37. // 符号表中,text和etext的下标
  38. uint64_t text_vaddr, etext_vaddr;
  39. /**
  40. * @brief 读取一个符号到entry之中
  41. *
  42. * @param filp stdin的文件指针
  43. * @param entry 待填写的entry
  44. * @return int 返回码
  45. */
  46. int read_symbol(FILE *filp, struct kernel_symbol_entry_t *entry)
  47. {
  48. // 本函数假设nm命令输出的结果中,每行最大512字节
  49. char str[512] = {0};
  50. int retval = fscanf(filp, "%llx %c %510s\n", &entry->vaddr, &entry->type, str);
  51. // 如果当前行不符合要求
  52. if (retval != 3)
  53. {
  54. if (retval != EOF)
  55. {
  56. // 如果不是输入流的结尾,说明该行不符合要求,将其过滤
  57. fgets(str, 512, filp);
  58. }
  59. return -1;
  60. }
  61. // malloc一块内存,然后把str的内容拷贝进去,接着修改symbol指针
  62. entry->symbol = strdup(str);
  63. entry->symbol_length = strlen(str) + 1; // +1的原因是.asciz指令会在字符串末尾自动添加结束符\0
  64. return 0;
  65. }
  66. /**
  67. * @brief 接收标准输入流的数据,解析nm命令输出的内容
  68. *
  69. * @param filp
  70. */
  71. void read_map(FILE *filp)
  72. {
  73. // 循环读入数据直到输入流结束
  74. while (!feof(filp))
  75. {
  76. // 给符号表扩容
  77. if (entry_count >= table_size)
  78. {
  79. table_size += 100;
  80. // 由于使用了realloc,因此符号表原有的内容会被自动的copy过去
  81. symbol_table = (struct kernel_symbol_entry_t *)realloc(symbol_table, sizeof(struct kernel_symbol_entry_t) * table_size);
  82. }
  83. // 若成功读取符号表的内容,则将计数器+1
  84. if (read_symbol(filp, &symbol_table[entry_count]) == 0)
  85. ++entry_count;
  86. }
  87. // 查找符号表中的text和etext标签
  88. for (uint64_t i = 0; i < entry_count; ++i)
  89. {
  90. if (strcmp(symbol_table[i].symbol, "_text")==0)
  91. text_vaddr = symbol_table[i].vaddr;
  92. if (strcmp(symbol_table[i].symbol, "_etext")==0)
  93. etext_vaddr = symbol_table[i].vaddr;
  94. }
  95. }
  96. /**
  97. * @brief 输出最终的kallsyms汇编代码文件
  98. * 直接输出到stdout,通过命令行的 > 命令,写入文件
  99. */
  100. void generate_result()
  101. {
  102. printf(".section .rodata\n\n");
  103. printf(".global kallsyms_address\n");
  104. printf(".align 8\n\n");
  105. printf("kallsyms_address:\n"); // 地址数组
  106. uint64_t last_vaddr = 0;
  107. uint64_t total_syms_to_write = 0; // 真正输出的符号的数量
  108. // 循环写入地址数组
  109. for (uint64_t i = 0; i < entry_count; ++i)
  110. {
  111. // 判断是否为text段的符号
  112. if (!symbol_to_write(symbol_table[i].vaddr, text_vaddr, etext_vaddr))
  113. continue;
  114. if (symbol_table[i].vaddr == last_vaddr)
  115. continue;
  116. // 输出符号地址
  117. printf("\t.quad\t%#llx\n", symbol_table[i].vaddr);
  118. ++total_syms_to_write;
  119. last_vaddr = symbol_table[i].vaddr;
  120. }
  121. putchar('\n');
  122. // 写入符号表的表项数量
  123. printf(".global kallsyms_num\n");
  124. printf(".align 8\n");
  125. printf("kallsyms_num:\n");
  126. printf("\t.quad\t%lld\n", total_syms_to_write);
  127. putchar('\n');
  128. // 循环写入符号名称的下标索引
  129. printf(".global kallsyms_names_index\n");
  130. printf(".align 8\n");
  131. printf("kallsyms_names_index:\n");
  132. uint64_t position = 0;
  133. last_vaddr = 0;
  134. for (uint64_t i = 0; i < entry_count; ++i)
  135. {
  136. // 判断是否为text段的符号
  137. if (!symbol_to_write(symbol_table[i].vaddr, text_vaddr, etext_vaddr))
  138. continue;
  139. if (symbol_table[i].vaddr == last_vaddr)
  140. continue;
  141. // 输出符号名称的偏移量
  142. printf("\t.quad\t%lld\n", position);
  143. position += symbol_table[i].symbol_length;
  144. last_vaddr = symbol_table[i].vaddr;
  145. }
  146. putchar('\n');
  147. // 输出符号名
  148. printf(".global kallsyms_names\n");
  149. printf(".align 8\n");
  150. printf("kallsyms_names:\n");
  151. last_vaddr = 0;
  152. for (uint64_t i = 0; i < entry_count; ++i)
  153. {
  154. // 判断是否为text段的符号
  155. if (!symbol_to_write(symbol_table[i].vaddr, text_vaddr, etext_vaddr))
  156. continue;
  157. if (symbol_table[i].vaddr == last_vaddr)
  158. continue;
  159. // 输出符号名称
  160. printf("\t.asciz\t\"%s\"\n", symbol_table[i].symbol);
  161. last_vaddr = symbol_table[i].vaddr;
  162. }
  163. putchar('\n');
  164. }
  165. int main(int argc, char **argv)
  166. {
  167. read_map(stdin);
  168. generate_result();
  169. }