求推荐一本引见C/C++调用CPU指令集的书

求推荐一本介绍C/C++调用CPU指令集的书
RT。最近想趁较为空闲,看点关于如何用C/c++调用指令集的书,不仅为了提高手上现有程序的效率,也为将来使用OPENCL这些异构计算API打些基础。
不过鉴于本人对这方面完全菜鸟,连该看哪本书都不知道。求老鸟们推荐几本。感激不尽。
------解决方案--------------------
EVEN and ALIGN Directives
Home 
------解决方案--------------------
  Overview 
------解决方案--------------------
  How Do I

Although the inline assembler doesn’t support most MASM directives, it does support EVEN and ALIGN. These directives put NOP (no operation) instructions in the assembly code as needed to align labels to specific boundaries. This makes instruction-fetch operations more efficient for some processors.

/ALIGN   (Section Alignment)
Home 
------解决方案--------------------
  Overview 
------解决方案--------------------
  How Do I 
------解决方案--------------------
  Linker Options

Syntax
/ALIGN:number

This option specifies the alignment of each section within the linear address space of the program. The number argument is in bytes and must be a power of two. The default is 4K. The linker issues a warning if the alignment produces an invalid image.

GlobalAlloc
The GlobalAlloc function allocates the specified number of bytes from the heap. Win32 memory management does not provide a separate local heap and global heap. 

This function is provided only for compatibility with 16-bit versions of Windows. 

HGLOBAL GlobalAlloc(
  UINT uFlags,    // allocation attributes
  DWORD dwBytes   // number of bytes to allocate
);
 
Parameters
uFlags 
Specifies how to allocate memory. If zero is specified, the default is GMEM_FIXED. This value can be one or more of the following flags, except for the incompatible combinations that are specifically noted. Flag Meaning 
GMEM_FIXED Allocates fixed memory. The return value is a pointer. 
GMEM_MOVEABLE Allocates movable memory. In Win32, memory blocks are never moved in physical memory, but they can be moved within the default heap. 
The return value is a handle to the memory object. To translate the handle into a pointer, use the GlobalLock function. 

This flag cannot be combined with the GMEM_FIXED flag. 
 
GPTR Combines the GMEM_FIXED and GMEM_ZEROINIT flags. 
GHND Combines the GMEM_MOVEABLE and GMEM_ZEROINIT flags. 
GMEM_DDESHARE
GMEM_SHARE This flag is provided primarily for compatibility with 16-bit Windows. However, this flag may be used by some applications to enhance the performance of DDE operations and therefore can be specified if the memory is to be used for DDE. . 
GMEM_DISCARDABLE Ignored. This flag is provided only for compatibility with 16-bit Windows.
In Win32, you must explicitly call the GlobalDiscard function to discard a block.

This flag cannot be combined with the GMEM_FIXED flag. 
 
GMEM_LOWER Ignored. This flag is provided only for compatibility with 16-bit Windows. 
GMEM_NOCOMPACT Ignored. This flag is provided only for compatibility with 16-bit Windows. 
GMEM_NODISCARD Ignored. This flag is provided only for compatibility with 16-bit Windows. 
GMEM_NOT_BANKED Ignored. This flag is provided only for compatibility with 16-bit Windows. 
GMEM_NOTIFY Ignored. This flag is provided only for compatibility with 16-bit Windows. 
GMEM_ZEROINIT Initializes memory contents to zero. 


dwBytes 
Specifies the number of bytes to allocate. If this parameter is zero and the uFlags parameter specifies the GMEM_MOVEABLE flag, the function returns a handle to a memory object that is marked as discarded.