内存模型可视化 - 从物理到Go语言

⚡ 寄存器 (Register)

CPU内部最快的存储
容量极小（几十字节~几百字节）
纳秒级访问延迟
直接参与运算

🚀 CPU缓存 (Cache)

L1: 32-64KB，延迟 ~1ns
L2: 256KB-1MB，延迟 ~4ns
L3: 8-32MB，延迟 ~10ns
缓存行 (Cache Line): 64字节

💾 物理内存 (RAM)

容量：8GB ~ 数百GB
访问延迟：~100ns
通过内存总线与CPU连接
以页(4KB)为单位管理

数据访问路径与缓存层次

已分配

空闲

寄存器

L1缓存

L2缓存

L3缓存

// 物理内存层次结构示意
type MemoryHierarchy struct {
    Registers []byte     // ~1KB,  访问延迟: 0.3ns
    L1Cache   []CacheLine // 32KB,  访问延迟: 1ns
    L2Cache   []CacheLine // 256KB, 访问延迟: 4ns
    L3Cache   []CacheLine // 16MB,  访问延迟: 10ns
    RAM       []Page      // 16GB,  访问延迟: 100ns
}

// 缓存行结构 (通常64字节)
type CacheLine struct {
    Tag    uint64  // 地址标记
    Data   [64]byte // 实际数据
    Flags  uint8   // MESI状态: Modified/Exclusive/Shared/Invalid
}

🗺️ 虚拟内存 (Virtual Memory)

每个进程拥有独立虚拟地址空间
64位系统: 128TB 用户空间
通过页表映射到物理内存
隔离进程，防止相互干扰

📑 页表与分页 (Paging)

页大小: 4KB (默认)
多级页表: PML4 → PDP → PD → PT
TLB: 缓存常用页表项
缺页中断 (Page Fault)

🔄 内存分配与回收

brk/mmap: 两种分配方式
伙伴系统 (Buddy System)
slab分配器: 小对象优化
swap: 物理内存不足时换出

虚拟地址空间与页表映射

代码段

数据段/已映射

BSS段

堆区

栈区

映射区

空闲页帧

// Linux 内存分配流程
// 1. malloc → 请求内存
// 2. 小于 128KB: brk() 扩展堆
// 3. 大于 128KB: mmap() 匿名映射

// 页表结构 (x86_64, 4级页表)
type PageTableEntry struct {
    Present     bool   // 是否在物理内存中
    Writable    bool   // 可写?
    User        bool   // 用户态可访问?
    Accessed    bool   // 是否被访问过
    Dirty       bool   // 是否被修改过
    PhysicalPFN uint64 // 物理页帧号
}

// 缺页中断处理
func handlePageFault(virtualAddr uintptr) {
    pte := walkPageTable(virtualAddr)  // 查找页表项
    if !pte.Present {
        frame := allocPhysicalPage()    // 分配物理页帧
        pte.PhysicalPFN = frame.PFN
        pte.Present = true
        updateTLB(virtualAddr, frame) // 更新TLB
    }
}

📦 Go内存分配器 (TCMalloc)

基于 Google TCMalloc 设计
按对象大小分级: Tiny/Small/Large
mspan: 内存管理基本单位
无锁分配 + 缓存亲和

🗑️ 垃圾回收 (GC)

三色标记-清除算法
并发标记 + STW 极短
写屏障 (Write Barrier)
目标: CPU占用 < 25%

📊 内存布局

栈: goroutine私有，自动伸缩
堆: 全局共享，GC管理
mcache: P本地缓存
mcentral/mheap: 全局分配

Go内存分配器架构 (TCMalloc风格)

已分配对象

空闲对象

栈/Goroutine

mcache (P本地)

mcentral (中心)

mheap (全局)

// Go 内存分配源码示意
// runtime/malloc.go

// size class 到 mspan 的映射
func mallocgc(size uintptr, typ *_type, needzero bool) unsafe.Pointer {
    if size <= maxSmallSize {              // < 32KB: 小对象
        if size < maxTinySize {              // < 16B: tiny 对象
            return tinymalloc(size)
        }
        span := c.alloc(size)                // mcache 分配
        return nextFreeFast(span)
    }
    return largeAlloc(size)                  // > 32KB: 大对象
}

// GC 三色标记
// 白色: 待扫描 → 灰色: 扫描中 → 黑色(绿色): 存活
func gcDrain(gcw *gcWork) {
    for !gcw.empty() {
        obj := gcw.tryGetFast()            // 取灰色对象
        if obj == 0 { break }
        scanobject(obj, gcw)               // 扫描对象引用
        // 引用到的白色对象 → 灰色
        // 当前对象 → 黑色(存活)
    }
}