我的目标是对一些指令集架构进行比较研究
对于每个指令集体系结构,我如何找到最常用的指令?
这是我正在考虑的步骤:
- 查找所选域的通用ISAs
- 查找每种ISA的流行程序
- 拆解程序说明(.code((哪个工具?(
- 收集有关指令格式、操作码和类型的统计信息。(哪种工具?(
这里有一个关于x86机器代码统计的非常好的研究:https://www.strchr.com/x86_machine_code_statistics
我试过以下命令进行拆卸,但似乎无法正确拆卸。分解后的代码显示了一些das
指令,这些指令不应出现在实际代码中。
ndisasm -b32 -a $(which which)
您可以尝试从.text部分收集助记符:
objdump --no-show-raw-insn
-M intel
-sDj .text $(which *program name*) | # <-- disassemble .text section
sed -n '/<.text>/, $ p' | # <-- skip raw hex
awk '{$1 = ""; print}' | # <-- remove offsets
sed '1d' # <-- delete annoying <.text> in first line
之后,您可以只获取助记符名称,并附加awk '{print $1}'
或以某种方式改变数据。
在所有这些之后,将sort | uniq -c
添加到前面的步骤中。所以我得到的命令看起来像:
objdump --no-show-raw-insn
-M intel
-sDj .text $(which *program name*) |
sed -n '/<.text>/, $ p' |
awk '{$1 = ""; print}' |
sed '1d' |
awk '{print $1}' | sort | uniq -c
它从程序的文本部分中打印出每个助记符的频率