ptmalloc的实现细节

其他 2019-05-13 21:36:05 阅读次数: 0

版权声明：版权所有，转载请注明出处 https://blog.csdn.net/songchuwang1868/article/details/90144080

如果对ptmalloc的基本设计还不熟悉，请先看：https://blog.csdn.net/songchuwang1868/article/details/89951543

一、bin数组

bin数组大体分成三个部分：

1、unsored bin数组

暂存一些没有排序的数据
unsored bin数组中的块马上就会分配给用户或者放到small/large bin数组中

2、small bin数组

每项指向一个双向链表，链表中每一项都是一样的大小
最小32Byte，16Byte递增，直到1K

3、large bin数组

每项是一个范围
每项指向的是双向链表，双向链表维护有序的块，除了fd和bk外还有fd_nextsize和bk_nextsize的使用

二、fast bin数组

独立于前面的bin数组
最小32Byte，16Byte递增，直到128Byte
单向链表，便于使用CAS实现无锁操作
使用arena分配内存时，先到fast bin中找，找到匹配的块直接返回，找到更大的块，切割需要的大小返回。由于fast bin中的块很散碎而没有找到，摘取fast bin中所有的块，进行合并。将合并后更大的块放到unsored bin中，遍历unsored bin找需要的块，遍历过程中顺便将unsored bin中的块放到small bin和large bin中。

三、arena

每个arena中包含了一个bin和一个fast_bin
每个进程中有最多有N个arena，N=cpu_num*2（32位系统），也就是说arena数仅仅与cpu数目相关
ptmalloc是C库中的功能，所以必定在用户层上，所以必定每个进程一份，也就是说每个进程有N个arena。所有跨越进程的共享资源都在内核中维护
同一个进程中的多个线程共享这对应进程中的N个arena
多个线程可以绑定到同一个arena上，当部分arena耗尽的情况下，一个线程也可能切换到其他arena

四、top chunk

每当arena管理的内存不够时，使用mmap（非主arena）或者brk（主arena）分配1M大小的堆空间
虽然分配了1M的空间，但不是直接使用，而是每次用4K，也就是每次用一个页面。未用到的页面设定为protected页，如果用户误写了protected页，段错误
在一个可用页中切割chunk
top chunk指向已切割chunk的最后，换言之，每次切割新的chunk，从top chunk处开始
当归还内存时，归还的chunk会与top chunk合并（也就是top chunk上移）

五、heap

这里的heap不是内存布局中的heap，而是一个malloc中的结构体
arena可能使用的内存超过1M，会分配多个Heap，并用链表维护
top chunk位域最后一个heap的最后一个chunk的后面
arena位于第一个Heap中
Heap1 M对齐，任意一个chunk要找到自己属于哪一个arena是很容易的，只看自己的高位，便能找到自己所属的heap，再定位到相应的arena
归还内存，使top chunk位移到heap开始的地方，说明整个heap都归还了，ptmalloc将整个heap还给系统
ptmalloc这里存在一个槽点，如果中间的heap基本空闲（但有几个chunk还没有回收），但对应的heap却得不到回收

六、thread cache

最新版的ptmalloc向tc malloc学习，使用了线程局部存储来优化设计，线性局部存储不熟请看：https://blog.csdn.net/songchuwang1868/article/details/90143332

ptmalloc中的thread cache有如下特点：

tcache与small bin类似，最小32Byte，16Byte递增，直到1K
每个链表最多7个chunk
每次申请内存，先到thread cache中找，没有再到arena中取找

猜你喜欢

转载自blog.csdn.net/songchuwang1868/article/details/90144080

ptmalloc的实现细节

ptmalloc堆实现

malloc的底层实现（ptmalloc）

ptmalloc

浅析malloc的底层实现原理（ptmalloc）

几种malloc实现原理 ptmalloc(glibc) && tcmalloc(google) && jemalloc(facebook)

ptmalloc机制

Kafka实现细节（上）

Kafka实现细节（下）

tensorflow prelu的实现细节

ConcurrentHashMap之实现细节

Kafka 几个实现细节

向实现细节低头

faster RCNN实现细节

RPN 具体实现细节

Java集合实现细节

CopyOnWriteList实现细节

JDK synchronized的实现细节

volatile的实现细节

LLE算法的实现细节

登录组件实现细节

一篇文章彻底讲懂malloc的实现（ptmalloc）

《C++开发技能树》004 语言类·指针和内存管理·glibc的内存实现ptmalloc

ptmalloc堆概述

glibc中的ptmalloc

ptmalloc的小总结

ptmalloc内存分配过程

ptmalloc 内存管理概述

关于Ptmalloc的简单介绍

ptmalloc底层原理剖析

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)