JVM、常量池、堆和地址

如果我在Jasmin程序集中创建一个新项目，然后将其存储，我会使用aload指令进行操作，因为它是一个地址：

    new Object
    dup
    invokespecial.....
    astore_3 ; load the object reference into local variable 3

现在，如果我想从常量池中保存一个字符串。。。我会用ldc创建它，然后用aload保存它：

    ldc "Great string"
    astore_3 ; save the reference to the actual string in the constant pool

现在。。。这些地址的格式和字节数是否相同？由于我使用相同的指令来加载和存储这些项，JVM必须能够区分属于常量池中的地址和堆中的地址？

在检查字节码时，在我的情况下，常量池中的实际地址似乎只是一个1字节的索引（我想常量池的主要引用也保存在某个地方）。。。现在我知道这是对常量池中某些UTF8数据的引用，但这是实际字符串所在的地方，还是只是对其他地方字节数组的引用？检查堆中"新对象"的地址我还没能做到……基本上，我需要弄清楚这两个内存区域如何使用相同形式的指令，以及JVM如何决定地址是常量池中的偏移量还是堆中的对象？

JVM解释的字节码不一定与.class文件中编写的字节码相同。许多JVM在不同的执行阶段执行所谓的字节码重写。

HotSpot JVM也是如此。初始化一个类时，HotSpot会用JVM特定的fast_aldc字节码重写引用常量池中String项的ldc字节码，该字节码引用CP缓存中的对象（即java.lang.String实例）。当第一次执行这样的fast_aldc字节码时，JVM解析常量池条目，在Java堆中创建一个String，并用对该String的引用填充CP缓存。在进一步执行相同的字节码时，JVM将立即从CP缓存中获得引用，并将其推送到Java堆栈。

在解释ldc字节码（或其重写形式）之后，栈顶将包含对Java堆中对象的有效引用。new字节码产生了相同类型的引用。因此，没有必要区分引用类型。

翻译就是这样工作的。当然，在一个方法被JIT编译后，就不再有字节码、常量池引用等了。所有这些都只是抽象。只是一个模型。

首先，整个字节码格式只是VM提供的抽象。它不一定与运行时代码或内存的实际表示有任何相似之处。

其次，常量池是一个最多包含65535个条目的表，使用16位索引。由于使用小索引和类别1类型对常量池进行索引是一项常见的任务，因此有一条专门的简写指令-ldc。

ldc指令使用单字节索引，因此它只能用于前255个条目。如果您想访问以上的条目，则需要使用两字节形式ldc_w。这种情况类似于其他简写指令，例如aload_3 vs aload3 vs wide aload3。

再说一遍，这都是一个抽象概念。在实践中，VM将常量池转换为更友好的内部格式，并可以将指向其运行时位置的实际指针编译到代码中。但这只是一种可能的实现方式。

相关内容

最新更新

热门标签：