Java虚拟机（二）对象的创建与OOP-Klass模型

前言

在前一篇文章中我们学习了Java虚拟机的结构原理与运行时数据区域，那么我们大概知道了Java虚拟机的内存的概况，那么内存中的数据是如何创建和访问的呢？这篇文章会给你答案。

1.对象的创建

对象的创建通常是通过new一个对象而已，当虚拟机接收到一个new指令时，它会做如下的操作。
（1）判断对象对应的类是否加载、链接、初始化
虚拟机接收到一条new指令时，首先会去检查这个指定的参数是否能在常量池中定位到一个类的符号引用，并且检查这个符号引用代表的类是否已被类加载器加载、链接和初始化过。如果没有则先执行相应的类加载过程。关于类加载器我们在前一篇文章中已经提到过，这里不再赘述。

（2）为对象分配内存
类加载完成后，接着会在Java堆中划分一块内存分配给对象。内存分配根据Java堆是否规整，有两种方式：

指针碰撞：如果Java堆的内存是规整，即所有用过的内存放在一边，而空闲的的放在另一边。分配内存时将位于中间的指针指示器向空闲的内存移动一段与对象大小相等的距离，这样便完成分配内存工作。
空闲列表：如果Java堆的内存不是规整的，则需要由虚拟机维护一个列表来记录那些内存是可用的，这样在分配的时候可以从列表中查询到足够大的内存分配给对象，并在分配后更新列表记录。

Java堆的内存是否规整根据所采用的来及收集器是否带有压缩整理功能有关，关于垃圾收集器，本系列后面的文章会介绍。

（3）处理并发安全问题
创建对象是一个非常频繁的操作，所以需要解决并发的问题，有两种方式：

对分配内存空间的动作进行同步处理，比如在虚拟机采用CAS算法并配上失败重试的方式保证更新操作的原子性。
每个线程在Java堆中预先分配一小块内存，这块内存称为本地线程分配缓冲（Thread Local Allocation Buffer）简写为TLAB，线程需要分配内存时，就在对应线程的TLAB上分配内存，当线程中的TLAB用完并且被分配到了新的TLAB时，这时候才需要同步锁定。通过-XX:+/-UserTLAB参数来设定虚拟机是否使用TLAB。

（4）初始化分配到的内存空间
将分配到的内存，除了对象头都初始化为零值。

（5）设置对象的对象头
将对象的所属类、对象的HashCode和对象的GC分代年龄等数据存储在对象的对象头中。

（6）执行init方法进行初始化
执行init方法，初始化对象的成员变量、调用类的构造方法，这样一个对象就被创建了出来。

2.对象的堆内存布局

对象创建完毕，并且已经在Java堆中分配了内存，那么对象在堆内存是如何进行布局的呢？
以HotSpot虚拟机为例，对象在堆内存的布局分为三个区域，分别是对象头（Header）、实例数据（Instance Data）、对齐填充（Padding）。

对象头：对象头包括两部分信息分别是Mark World和元数据指针，Mark World用于存储对象运行时的数据，比如HashCode、锁状态标志、GC分代年龄等。而元数据指针用于指向方法区的中目标类的类型信息，通过元数据指针可以确定对象的具体类型。
实例数据：用于存储对象中的各种类型的字段信息（包括从父类继承来的）。
对齐填充：对齐填充不一定存在，起到了占位符的作用，没有特别的含义。

对象的内存布局如下图所示。
堆内存布局.png

3.HotSpot的对象模型

HotSpot中采用了OOP-Klass模型，它是用来描述Java对象实例的一种模型，OOP（Ordinary Object Pointer）指的是普通对象指针，而Klass用来描述对象实例的具体类型。
HotSpot中，用instanceOopDesc 和 arrayOopDesc 来描述对象头，其中arrayOopDesc对象用于描述数组类型。
instanceOopDesc的代码如下所示。
openjdk/hotspot/src/share/vm/oops/instanceOop.hpp

class instanceOopDesc : public oopDesc {
 public:
  // aligned header size.
  static int header_size() { return sizeof(instanceOopDesc)/HeapWordSize; }

  // If compressed, the offset of the fields of the instance may not be aligned.
  static int base_offset_in_bytes() {
    // offset computation code breaks if UseCompressedClassPointers
    // only is true
    return (UseCompressedOops && UseCompressedClassPointers) ?
             klass_gap_offset_in_bytes() :
             sizeof(instanceOopDesc);
  }

  static bool contains_field_offset(int offset, int nonstatic_field_size) {
    int base_in_bytes = base_offset_in_bytes();
    return (offset >= base_in_bytes &&
            (offset-base_in_bytes) < nonstatic_field_size * heapOopSize);
  }
};

可以看出instanceOopDesc继承自oopDesc：
openjdk/hotspot/src/share/vm/oops/oop.hpp

class oopDesc {
  friend class VMStructs;
 private:
  volatile markOop  _mark;
  union _metadata {
    Klass*      _klass;
    narrowKlass _compressed_klass;
  } _metadata;

  // Fast access to barrier set.  Must be initialized.
  static BarrierSet* _bs;
...
}

oopDesc中包含两个数据成员：_mark 和 _metadata。其中markOop类型的_mark对象指的是前面讲到的Mark World。_metadata是一个共用体，其中_klass是普通指针，_compressed_klass是压缩类指针，它们就是前面讲到的元数据指针，这两个指针都指向instanceKlass对象，它用来描述对象的具体类型。
instanceKlass的代码如下所示。
openjdk/hotspot/src/share/vm/oops/instanceKlass.hpp

class InstanceKlass: public Klass {
  ...
  enum ClassState {
    allocated,                          // allocated (but not yet linked)
    loaded,                             // loaded and inserted in class hierarchy (but not linked yet)
    linked,                             // successfully linked/verified (but not initialized yet)
    being_initialized,                  // currently running class initializer
    fully_initialized,                  // initialized (successfull final state)
    initialization_error                // error happened during initialization
  };
  ...
 }