谈谈vmp的还原(1)
本帖最后由 wai1216 于 2018-3-19 18:04 编辑0x00 前言本来想等到54之前发的,看到有朋友提前发相关文章了,没办法我也只能提前发了。起因是校长叫我写一个vm引擎,然后我看了一两个月的vmp, 大概摸清楚了,正准备动手的时候,结果生了一场重病耽误了很久。拖到现在首先文章不同于其他的文章,从vmp是如何vm opcode入手,看完以后不说还原,相信爆破,静态分析也应该有所帮助。主要是vmp3.x以下。
0x01 简介vmp的流程大体如下:直接定位到流程:很直观,首先读了vmp_opcode_begin_block end_block然后计算_vm_opcode_size没错,之前的帖子有提到,vmp作者设计了4套handle,就是这4套了。注意到上上图113行之后,同时我们也可以看出早期版本的构造下面这个之前也有提到先允许我跳过esi的构造以及修复,继续讲下去
可以看到vmp通过这样方式实现jmp vm_entry,所以有些vm插件会通过这种方式来定位到入口68 xx xx xx xx e9 xx xx xx xx之后,创建区段vmp0
set jmp_entry之后写之前的push esi jmp vm_entry然后写完之后写vmp1区段,流程大概就这个样子,当然我跳过了构造esi以及对esi的修正
0x10 反汇编引擎之所以会先谈谈这个,因为如果不看懂这个,后面的vm流程肯定看不懂
为了逆出这个反汇编引擎,我看了几遍opcode的构造方式以及一份开源的反汇编引擎(libudis86)。不过正因为如此,我才大概猜测出来一部分,vmp作者是如何构造这套vm的。这个函数大概3000+行这下面通过这两条指令来看看是怎么反汇编的,当然需要一些基础知识。817D FC 33020000 cmp dword ptr ss:,0x233//563
75 09 jnz short zf.0040D7E2从文件读出opcode 0x81首先判断type注意到*(a2-10)其实是对应的这个东西上个图就明白为什么是 (xx & 2 ) == 2了然后读modrm 0x7D进行查找mnemonic得到0x43 对应关系如下:之后就是解析modrm了挺精妙的,看图就好先对modrm.mod进行分析判断是否行如如果是 判断是否有address size override prefix判断是否包含sib读取disp之后再读取immediate创建下一个结构体,读取opcode 0x75其他的没啥好说的看一看,_vmp_SetJccIndex是不是感觉很有意思把hex & 0xf然后switch可能这样不是很明白
那么我们先看看0x70~0x7f这些opcode是什么那么对照一下就明白了Vmp作者为了区分溢不溢出 低于不低于做了一个很有意思的事情初始化了一个0x11然后把不溢出不低于的,也就是形如jnx 带n的这样做了
0x11|2
理解了之后,我们就可以得到反汇编的结构了对应:
0x11 结束语写得有点仓促,下一贴主要是讲vmp是如何膨胀指令的 我仿佛看到了VMP的威力 这个必须要顶楼主辛苦耗费了不少精力 精品系列好文,推荐学习 ~ 牛的一逼啊~~到现在才在学C++的我,基本上抓瞎! 分析的精彩,佩服 楼主功力深厚,赞赞赞。 可以啊,写的还不错呢 收藏,学习,VM_CODE还是头疼…… 厉害呀,菜菜都不敢碰vmp。