我是一名计算机科学专业的学生,目前正在学习编译课程,我们在课程中有一个项目,用IC语言构建编译器,这是 Java 语言的一个子集。我处于最后部分,我需要生成MIPS程序集,而无需从IR树分配寄存器。
我试图了解对象实例在MIPS程序集中的表示方式。我知道我需要为每个对象实例生成一个虚拟函数表(其中包含与实例相关的函数的地址)。
我的问题是:
我是否需要为类字段做一个类似的表,因为字段也是继承的。你建议怎么做?
此外,如果有人能举例说明继承类和字段的对象实例的真实MIPS汇编代码的外观,我将不胜感激。
例如,MIPS代码是什么样的:
class A{
int x;
void f(){}
}
class B extends A{
int y;
void g(){}
void main(){
A newObj = new B();
newObj.f();
newObj.x++;
}
}
我只解决这部分问题:
此外,如果有人能举例说明真实的MIPS汇编代码的外观,我将不胜感激
。
我确实以某种方式将您的示例重写为 C++,C++具有少量开关的编译器不会完全优化它并保留字段和调用(如果您想知道为什么使用volatile
,以及其他一些事情,只是为了防止编译器产生像return value = 5, return
这样的汇编......C++编译器往往有点讨厌的优化,当你只想看到一些"示例"代码时)。
class A {
public:
volatile int x;
virtual void f(){
++x;
}
};
class B : public A {
public:
volatile int y;
B(int i) {
y = i;
x = i-1;
}
virtual void f(){
x += 2;
}
void g() {
f();
x += 3;
++y;
}
};
int footest(int in) {
B* obj = new B(in);
A* obj_A_alias = obj;
obj_A_alias->f(); // calling B::f(), because f is virtual
obj->g();
obj->f();
obj->A::f(); // forcing A::f() call (on B instance)
int result = obj->x + obj->y;
delete obj;
return result;
}
现在,如果您将其放入 http://godbolt.org/并使用选项-O3 -std=c++11 -fno-loop-optimize -fno-inline
将编译器设置为MIPS gcc 5.4,您将获得以下输出:
$LFB0 = .
A::f():
$LVL0 = .
lw $2,4($4)
addiu $2,$2,1
sw $2,4($4)
j $31
nop
$LFB7 = .
B::f():
$LVL1 = .
lw $2,4($4)
addiu $2,$2,2
sw $2,4($4)
j $31
nop
$LFB3 = .
A::A():
$LVL2 = .
$LBB2 = .
lui $2,%hi(vtable for A+8)
addiu $2,$2,%lo(vtable for A+8)
j $31
sw $2,0($4)
$LBE2 = .
A::A() = A::A()
$LFB5 = .
B::B(int):
$LVL3 = .
addiu $sp,$sp,-40
sw $17,32($sp)
move $17,$5
sw $31,36($sp)
sw $16,28($sp)
$LBB3 = .
jal A::A()
move $16,$4
$LVL4 = .
addiu $2,$17,-1
$LBE3 = .
lw $31,36($sp)
$LBB4 = .
sw $17,8($16)
sw $2,4($16)
lui $2,%hi(vtable for B+8)
$LBE4 = .
lw $17,32($sp)
$LVL5 = .
$LBB5 = .
addiu $2,$2,%lo(vtable for B+8)
sw $2,0($16)
$LBE5 = .
lw $16,28($sp)
$LVL6 = .
j $31
addiu $sp,$sp,40
B::B(int) = B::B(int)
$LFB8 = .
B::g():
$LVL7 = .
lw $2,0($4)
addiu $sp,$sp,-32
sw $16,24($sp)
sw $31,28($sp)
lw $25,0($2)
jalr $25
move $16,$4
$LVL8 = .
lw $2,4($16)
lw $31,28($sp)
addiu $2,$2,3
sw $2,4($16)
lw $2,8($16)
addiu $2,$2,1
sw $2,8($16)
lw $16,24($sp)
$LVL9 = .
j $31
addiu $sp,$sp,32
$LFB9 = .
footest(int):
$LVL10 = .
lui $28,%hi(__gnu_local_gp)
addiu $sp,$sp,-32
addiu $28,$28,%lo(__gnu_local_gp)
sw $16,24($sp)
move $16,$4
$LVL11 = .
sw $31,28($sp)
lw $25,%call16(operator new(unsigned int))($28)
1: jalr $25
li $4,12 # 0xc
$LVL12 = .
move $5,$16
move $16,$2
$LVL13 = .
jal B::B(int)
move $4,$2
$LVL14 = .
$LVL15 = .
jal B::f()
move $4,$16
$LVL16 = .
jal B::g()
move $4,$16
$LVL17 = .
lw $2,0($16)
lw $25,0($2)
jalr $25
move $4,$16
$LVL18 = .
jal A::f()
move $4,$16
$LVL19 = .
move $4,$16
lw $28,16($sp)
lw $2,4($16)
lw $16,8($16)
$LVL20 = .
lw $25,%call16(operator delete(void*))($28)
$LVL21 = .
1: jalr $25
addu $16,$2,$16
$LVL22 = .
move $2,$16
lw $31,28($sp)
lw $16,24($sp)
$LVL23 = .
j $31
addiu $sp,$sp,32
typeinfo name for A:
.ascii "1A 00"
typeinfo for A:
.word vtable for __cxxabiv1::__class_type_info+8
.word typeinfo name for A
typeinfo name for B:
.ascii "1B 00"
typeinfo for B:
.word vtable for __cxxabiv1::__si_class_type_info+8
.word typeinfo name for B
.word typeinfo for A
vtable for A:
.word 0
.word typeinfo for A
.word A::f()
vtable for B:
.word 0
.word typeinfo for B
.word B::f()
在实际站点上尝试一下,因此您还将获得彩色提示,其中一部分代码属于源代码的哪一部分(如果这是您的目标平台,还有MIPS64编译器)。
编辑:您可能也应该尝试-O0
选项,该输出很可能与您通过一个学生单独项目可以合理实现的目标更相关。
我在MIPS方面不够好,无法向你解释那里发生了什么,我也没有时间这样做,但是如果你正在制作编译器,你应该比我更了解它。
C++源演示了如何完成虚拟呼叫 ($LVL17
)、非虚拟父呼叫 ($LVL18
)、非虚拟自助呼叫 ($LVL16
) 和字段值访问 ($LVL19
)。
现在请记住,这是专业优化的工具,因此,如果您以不太理想的解决方案结束,它应该没问题。还要记住,Java 和 C++ 的编译略有不同,在 Java 中,最终结果并不像C++那样"静态",所以可能是你没有足够的信息来像C++那样积极优化,比如非虚函数调用只是用目标地址硬编码,或者字段也是如此......
毕竟,如果是Java,你不能指望它是最佳的,对于托管运行时语言来说,它很好,再加上高质量的JIT编译器,基本代码速度可以与C++相当,但是一旦你受到低效的Java数据结构的打击,C++"嗖"沿着地平线和超越地平线。