2.1 PE结构:文件映射进内存
PE结构是Windows
系统下最常用的可执行文件格式,理解PE文件格式不仅可以理解操作系统的加载流程,还可以更好的理解操作系统对进程和内存相关的管理知识,在任何一款操作系统中,可执行程序在被装入内存之前都是以文件的形式存放在磁盘中的,在早期DOS操作系统中,是以COM文件的格式存储的,该文件格式限制了只能使用代码段,堆栈寻址也被限制在了64KB的段中,由于PC芯片的快速发展这种文件格式极大的制约了软件的发展。
为了应对这种局面,微软的工程师们就发明了新的文件格式(EXE文件),该文件格式在代码段前面增加了文件头结构,文件头中包括各种说明数据,如程序的入口地址,堆栈的位置,重定位表等,显然可执行文件的格式是操作系统工作方式的真实写照,不同的系统之间文件格式千差万别,从而导致不同系统中的可执行文件无法跨平台运行。
PE结构包含了各类结构体,DOS头,PE标识,文件头,可选头,目录结构,节表,导入表,导出表,重定位表,资源表等等,要想掌握PE结构首相要对这些表有一个整体上的认识,Windows NT 系统中可执行文件使用微软设计的新的文件格式,也就是至今还在使用的PE格式,PE文件的基本结构如下图所示:
在PE文件中,代码,已初始化的数据,资源和重定位信息等数据被按照属性分类放到不同的Section(节区/或简称为节)
中,而每个节区的属性和位置等信息用一个IMAGE_SECTION_HEADER
结构来描述,所有的IMAGE_SECTION_HEADER
结构组成了一个节表(Section Table)
,节表数据在PE文件中被放在所有节数据的前面。
在PE文件中将同样属性的数据分类放在一起是为了统一描述这些数据装入内存后的页面属性,由于数据是按照属性在节中放置的,不同用途但是属性相同的数据可能被放在同一个节中,PE文件头被放置在节和节表的前面,上面介绍的是真正的PE文件,为了兼容以前的DOS系统,所以保留了DOS的文件格式,接下来笔者将带大家从最基本的读入文件开始依次实现对PE文件的解析,并使用C语言实现一个PeView
结构解析器。
在解析PE文件之前,我们首先要做的则是将PE文件从磁盘中读入到内存,有两种方式可以实现,一种是通过ReadFile
函数将完整的数据读入内存,该方法会消耗更多的内存资源这里并不推荐使用,第二种方式则是采用映射的模式,所谓的映射则是将一个磁盘中的部分数据读入内存,当需要使用该片区域时由操作系统动态的装载一部分,该方式也是笔者推荐的一种实现模式;
一般来说映射文件的流程是,使用CreateFile()
打开一个磁盘文件,接着使用CreateFileMapping()
函数创建文件的内存映像,最后使用MapViewOfFile()
读取映射中的内存并返回一个句柄,后面的程序就可以通过该句柄操作打开后的文件。
CreateFile
用来创建或打开文件的API函数,它可以接受一个文件名作为输入参数,并返回一个文件句柄。文件句柄是用来标识打开的文件的唯一标识符,后续对该文件的操作需要使用这个句柄。下面是CreateFile
函数的原型:
HANDLE CreateFile( |
其中,各个参数的含义如下:
- lpFileName:指向null结尾字符串的指针,该字符串是文件名或文件的路径。
- dwDesiredAccess:一个32位的
AccessMask
值,用来表示对文件的访问权限。 - dwShareMode: 一个32位的
ShareMode
值,它表示其他进程可以如何访问文件。 - lpSecurityAttributes:指向
SECURITY_ATTRIBUTES
结构体的指针,表示安全属性。 - dwCreationDisposition:一个32位的值,它表示对文件的创建选项如何操作。
- dwFlagsAndAttributes:一个32位的值,用来指定文件的属性和标志。
- hTemplateFile:可选的模板文件句柄,用来将文件属性/属性设置为其它文件的属性/属性。
函数返回值为一个文件对象的句柄,如果函数执行失败,则返回INVALID_HANDLE_VALUE(即-1)。
CreateFileMapping
用来创建文件的内存映像的API函数。它可以将一个文件映射到内存中,这样我们就可以像访问内存一样访问文件。这个函数需要传入一个文件句柄以及一个映像的大小。它返回一个句柄,表示创建的内存映像。下面是CreateFileMapping
函数的原型:
HANDLE CreateFileMapping( |
其中,各个参数的含义如下:
- hFile:要映射到内存中的文件的句柄
- lpAttributes:指向
SECURITY_ATTRIBUTES
结构体的指针,它描述内存映射对象的安全性,如果为NULL,则内存映射对象不可继承。 - flProtect:一组标志位,它们指定内存映射区域的内存保护属性;
- dwMaximumSizeHigh:文件映像的高32位字节大小
- dwMaximumSizeLow:文件映像的低32位字节大小
- lpName:映像名,可以为NULL;而且,如果该参数不为空,映像对象就成为本地系统对象,可以通过名字查找映像。
函数返回值为一个文件映射对象的句柄,如果函数执行失败,返回值为NULL。
MapViewOfFile
用来读取映射中的内存的API函数。它需要传入一个映像的句柄以及一个偏移量,用来指定从哪个位置开始读取内存。该函数返回一个指向映射内存的指针,我们可以使用它来读取或修改映射内存中的数据。下面是MapViewOfFile
函数的原型:
LPVOID MapViewOfFile( |
其中,各个参数的含义如下:
- hFileMappingObject:文件映射对象的句柄,可以使用
CreateFileMapping
函数创建,表示要映射到内存中的文件或共享内存的句柄。 - dwDesiredAccess:一个32位的
AccessMask
值,用来表示对内存的访问权限。可以设置为FILE_MAP_READ、FILE_MAP_WRITE、FILE_MAP_ALL_ACCESS
等。 - dwFileOffsetHigh:文件偏移的高32位字节个数。
- dwFileOffsetLow:文件偏移的低32位字节个数。
- dwNumberOfBytesToMap:要映射到内存中的字节数。
函数返回值为指向映射内存的指针,如果函数执行失败,则返回NULL。在使用完内存映像后,读者记得使用UnmapViewOfFile()
函数来释放映像内存,使用CloseHandle()
函数来关闭文件句柄和映像句柄,以便操作系统可以回收资源。
有了上述几个关键API函数那么实现内存映射功能将会变得很容易实现,直接来看一下如下代码,当程序运行后会自动将c://pe/x86.exe
目录下的文件读入内存,并返回一个lpMapAddress
文件句柄;
|