细说MySQL 之MEM_ROOT

6700阅读 0评论2015-12-23 zxszcaijin
分类:Mysql/postgreSQL

    这篇文章会详细解说MySQL中使用非常广泛的MEM_ROOT的结构体,同时省去debug部分的信息,仅分析正常情况下,mysql中使用MEM_ROOT来做内存分配的部分。

  在具体分析之前我们先例举在该结构体使用过程中用到的一些宏:

点击(此处)折叠或打开

  1. #define MALLOC_OVERHEAD 8 //分配过程中,需要保留一部分额外的空间
  2. #define ALLOC_MAX_BLOCK_TO_DROP 4096 //后续会继续分析该宏的用途
  3. #define ALLOC_MAX_BLOCK_USAGE_BEFORE_DROP 10 //后续会继续分析该宏的用途

  4. #define ALIGN_SIZE(A) MY_ALIGN((A),sizeof(double))
  5. #define MY_ALIGN(A,L) (((A) + (L) - 1) & ~((L) - 1))

  6. #define ALLOC_ROOT_MIN_BLOCK_SIZE (MALLOC_OVERHEAD + sizeof(USED_MEM) + 8)
  7. /* Define some useful general macros (should be done after all headers). */
  8. #define MY_MAX(a, b) ((a) > (b) ? (a) : (b)) //求两个数值之间的最大值
  9. #define MY_MIN(a, b) ((a) < (b) ? (a) : (b)) //求两个数值之间的最小值
  
下面再来看看MEM_ROOT结构体相关的信息:

点击(此处)折叠或打开

  1. typedef struct st_mem_root
  2. {
  3. USED_MEM *free; //free block link list的链表头指针
  4. USED_MEM *used;//used block link list的链表头指针
  5. USED_MEM *pre_alloc; //预先分配的block
  6. size_t min_malloc; //如果block剩下的可用空间小于该值,将会从free list移动到used list
  7. size_t block_size; //每次初始化的空间大小
  8. unsigned int block_num; //记录实际的block数量,初始化为4
  9. unsigned int first_block_usage; //free list中的第一个block 测试不满足分配空间大小的次数
  10. void (*error_handler)(void);//分配失败的错误处理函数
  11. } MEM_ROOT;

 以下是分配具体的block信息.

点击(此处)折叠或打开

  1. typedef struct st_used_mem
  2. {
  3. struct st_used_mem *next; //指向下一个分配的block
  4. unsigned int left; //该block剩余的空间大小
  5. unsigned int size; //该block的总大小
  6. } USED_MEM;
 其实MEM_ROOT在分配过程中,是通过双向链表来管理used和free的block:
  

 MEM_ROOT的初始化过程如下:

点击(此处)折叠或打开

  1. void init_alloc_root(MEM_ROOT *mem_root, size_t block_size,size_t pre_alloc_size __attribute__((unused)))
  2. {
  3. mem_root->free= mem_root->used= mem_root->pre_alloc= 0;
  4. mem_root->min_malloc= 32;
  5. mem_root->block_size= block_size - ALLOC_ROOT_MIN_BLOCK_SIZE;
  6. mem_root->error_handler= 0;
  7. mem_root->block_num= 4; /* We shift this with >>2 */
  8. mem_root->first_block_usage= 0;
  9. }

初始化过程中,block_size空间为block_size-ALLOC_ROOT_MIN_BLOCK_SIZE。因为在内存不够,需要
扩容时,是通过mem_root->block_num >>2 * block_size 来扩容的,所以mem_root->block_num >>2 至少为1
,因此在初始化的过程中mem_root->block_num=4(注:4>>2=1)。


下面来看看具体分配内存的步骤:

点击(此处)折叠或打开

  1. void *alloc_root(MEM_ROOT *mem_root, size_t length)
  2. {
  3. size_t get_size, block_size;
  4. uchar* point;
  5. reg1 USED_MEM *next= 0;
  6. reg2 USED_MEM **prev;

  7. length= ALIGN_SIZE(length);
  8. if ((*(prev= &mem_root->free)) != NULL)
  9. {
  10. if ((*prev)->left < length &&
  11. mem_root->first_block_usage++ >= ALLOC_MAX_BLOCK_USAGE_BEFORE_DROP &&
  12. (*prev)->left < ALLOC_MAX_BLOCK_TO_DROP)
  13. {
  14. next= *prev;
  15. *prev= next->next; /* Remove block from list */
  16. next->next= mem_root->used;
  17. mem_root->used= next;
  18. mem_root->first_block_usage= 0;
  19. }
  20. for (next= *prev ; next && next->left < length ; next= next->next)
  21. prev= &next->next;
  22. }
  23. if (! next)
  24. { /* Time to alloc new block */
  25. block_size= mem_root->block_size * (mem_root->block_num >> 2);
  26. get_size= length+ALIGN_SIZE(sizeof(USED_MEM));
  27. get_size= MY_MAX(get_size, block_size);

  28. if (!(next = (USED_MEM*) my_malloc(get_size,MYF(MY_WME | ME_FATALERROR))))
  29. {
  30. if (mem_root->error_handler)
  31. (*mem_root->error_handler)();
  32. DBUG_RETURN((void*) 0); /* purecov: inspected */
  33. }
  34. mem_root->block_num++;
  35. next->next= *prev;
  36. next->size= get_size;
  37. next->left= get_size-ALIGN_SIZE(sizeof(USED_MEM)); //bug:如果该block是通过mem_root->block_size * (mem_root->block_num >> 2)计算出来的,则已经去掉了ALIGN_SIZE(sizeof(USED_MEM),这里重复了。
  38. *prev=next;
  39. }

  40. point= (uchar*) ((char*) next+ (next->size-next->left));
  41. /*TODO: next part may be unneded due to mem_root->first_block_usage counter*/
  42. if ((next->left-= length) < mem_root->min_malloc)
  43. { /* Full block */
  44. *prev= next->next; /* Remove block from list */
  45. next->next= mem_root->used;
  46. mem_root->used= next;
  47. mem_root->first_block_usage= 0;
  48. }
  49. }

上述代码的具体逻辑如下:
1.查看free链表,寻找满足空间的block。如果找到了合适的block,则:
   1.1 直接返回该block从size-left处的初始地址即可。当然,在free list遍历的过程中,会去判断free list
         中第一个block中left的空间不满足需要分配的空间,且该block中已经查找过了10次   
         (ALLOC_MAX_BLOCK_USAGE_BEFORE_DROP)都不满足分配长度,且该block剩余空间小于  
         4k(ALLOC_MAX_BLOCK_TO_DROP),则将该block 移动到used链表中。
2.如果free链表中,没有合适的block,则:
   2.1 分配 mem_root->block_size * (mem_root->block_num >> 2)和length+ALIGN_SIZE(sizeof(USED_MEM))
         中比较大的作为新的block内存空间。
   2.2 根据该block的使用情况,将该block挂在used或者free链表上。
  
 这里需要注意的是二级指针的使用:

点击(此处)折叠或打开

  1. for (next= *prev ; next && next->left < length ; next= next->next)
  2. prev= &next->next;
  3. }
 prev指向的是最后一个block的next指向的地址的地址:
 
所以将prev的地址替换为new block的地址,即将该new block加到了free list的结尾:
*prev=next;

 

总结:
MEM_ROOT的内存分配采用的是启发式分配算法,随着后续block的数量越多,单个block的内存也会越大:block_size= mem_root->block_size * (mem_root->block_num >> 2) .
上一篇:MySQL 之动态字符串处理
下一篇:MySQL新特性之mysql_config_editor源码解析