浅析内存屏障以及在java中的应用

内存屏障

Posted by 杨一 on 2020-05-25

浅析内存屏障以及在java中的应用

  • 指令重排序

    • 程序在运行时内存实际的访问顺序和程序代码编写的访问顺序不一定一致,这就是内存乱序访问。
    • 内存乱序访问行为出现的理由是为了提升程序运行时的性能。这种内存乱序问题主要是由两种原因的:
      编译器在编译时进行了编译优化,导致指令重排;在多cpu环境下,为了尽可能地避免处理器访问主内存的时间开销,处理器大多会利用缓存(cache)以提高性能。
    • 在这种模型下会存在一个现象,即缓存中的数据与主内存的数据并不是实时同步的,各CPU(或CPU核心)间缓存的数据也不是实时同步的。这导致在同一个时间点,各CPU所看到同一内存地址的数据的值可能是不一致的。
      从程序的视角来看,就是在同一个时间点,各个线程所看到的共享变量的值可能是不一致的。
  • java 内存模型中的happen before原则

    • JSR-1337制定了Java内存模型(Java Memory Model, JMM)中规定的hb原则大致有以下几点:
      • 程序次序法则:线程中的每个动作A都happens-before于该线程中的每一个动作B,其中,在程序中,所有的动作B都能出现在A之后。
      • 监视器锁法则:对一个监视器锁的解锁 happens-before于每一个后续对同一监视器锁的加锁。
      • volatile变量法则:对volatile域的写入操作happens-before于每一个后续对同一个域的读写操作。
      • 线程启动法则:在一个线程里,对Thread.start的调用会happens-before于每个启动线程的动作。
      • 线程终结法则:线程中的任何动作都happens-before于其他线程检测到这个线程已经终结、或者从Thread.join调用中成功返回,或Thread.isAlive返回false。
      • 中断法则:一个线程调用另一个线程的interrupt happens-before于被中断的线程发现中断。
      • 传递性:如果A happens-before于B,且B happens-before于C,则A happens-before于C。
    • jmm 对java语义的比较重要的两个扩展是:
      • 对volatile语义的扩展保证了volatile变量在一些情况下不会重排序,volatile的64位变量double和long的读取和赋值操作都是原子的。
      • 对final语义的扩展保证一个对象的构建方法结束前,所有final成员变量都必须完成初始化(前提是没有this引用溢出)。
  • 内存屏障(Memory Barrier)

    • Memory barrier 能够让 CPU 或编译器在内存访问上有序。一个 Memory barrier 之前的内存访问操作必定先于其之后的完成。
    • Memory barrier是一种CPU指令,用于控制特定条件下的重排序和内存可见性问题。Java编译器也会根据内存屏障的规则禁止重排序。
    • 有的处理器的重排序规则较严,无需内存屏障也能很好的工作,Java编译器会在这种情况下不放置内存屏障。
    • Memory Barrier可以被分为以下几种类型:
      • LoadLoad屏障:对于这样的语句Load1; LoadLoad; Load2,在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。
      • StoreStore屏障:对于这样的语句Store1; StoreStore; Store2,在Store2及后续写入操作执行前,保证Store1的写入操作对其它处理器可见。
      • LoadStore屏障:对于这样的语句Load1; LoadStore; Store2,在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。
        *StoreLoad屏障:对于这样的语句Store1; StoreLoad; Load2,在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。 它的开销是四种屏障中最大的、在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能。
      • Oracle的JDK中提供了Unsafe. putOrderedObject,Unsafe. putOrderedInt,Unsafe. putOrderedLong这三个方法,JDK会在执行这三个方法时插入StoreStore内存屏障,避免发生写操作重排序。而在Intel 64/IA-32架构下,StoreStore屏障并不需要,Java编译器会将StoreStore屏障去除。比起写入volatile变量之后执行StoreLoad屏障的巨大开销,采用这种方法除了避免重排序而带来的性能损失以外,不会带来其它的性能开销。具体用法可以看下disruptor的Sequence的set方法。
      • Intel 64/IA-32架构下写操作之间不会发生重排序,也就是说在处理器上操作的顺序是可以保证的,这时候使用volatile来避免重排序是多此一举的。但是,Java编译器却可能生成重排序后的指令。采用putOrderedObject可以解决这个问题。
      • 即使在其它会发生写写重排序的处理器中,由于StoreStore屏障的性能损耗小于StoreLoad屏障,采用这一方法也是一种可行的方案。但值得再次注意的是,这一方案不是对volatile语义的等价替换,而是在特定场景下做的特殊优化,它仅避免了写写重排序,但不保证内存可见性。
  • volatile语义中的内存屏障

    • 在每个volatile写操作前插入StoreStore屏障,在写操作后插入StoreLoad屏障;
      在每个volatile读操作前插入LoadLoad屏障,在读操作后插入LoadStore屏障;
    • volatile的内存屏障策略非常严格保守,保证了线程可见性。
  • final语义中的内存屏障

    • 新建对象过程中,构造体中对final域的初始化写入(StoreStore屏障)和这个对象赋值给其他引用变量,这两个操作不能重排序;
    • 初次读包含final域的对象引用和读取这个final域(LoadLoad屏障),这两个操作不能重排序;
    • Intel 64/IA-32架构下写操作之间不会发生重排序StoreStore会被省略,这种架构下也不会对逻辑上有先后依赖关系的操作进行重排序,所以LoadLoad也会变省略。