《第十三章高级指针话题》

阅读量：6908 次

发布时间：2019-06-27

本文共 6495 字，大约阅读时间需要 21 分钟。

一、

先通过一个小程序来看一看：

#include
       
        void foo(int x, int y, int z){    printf("x = %d at [%X]n", x, &x);    printf("y = %d at [%X]n", y, &y);    printf("z = %d at [%X]n", z, &z);}int main(int argc, char *argv[]){    foo(100, 200, 300);    return 0;}

运行结果：

x = 100 at [BFE28760]

y = 200 at [BFE28764]

z = 300 at [BFE28768]

　　C程序栈底为高地址，栈顶为低地址，因此上面的实例可以说明函数参数入栈顺序的确是从右至左的。可到底为什么呢？查了一直些文献得知，参数入栈顺序是和具体编译器实现相关的。比如，Pascal语言中参数就是从左到右入栈的，有些语言中还可以通过修饰符进行指定，如Visual C++.即然两种方式都可以，为什么C语言要选择从右至左呢？

进一步发现，Pascal语言不支持可变长参数，而C语言支持这种特色，正是这个原因使得C语言函数参数入栈顺序为从右至左。具体原因为：C方式参数入栈顺序(从右至左)的好处就是可以动态变化参数个数。通过栈堆分析可知，自左向右的入栈方式，最前面的参数被压在栈底。除非知道参数个数，否则是无法通过栈指针的相对位移求得最左边的参数。这样就变成了左边参数的个数不确定，正好和动态参数个数的方向相反。

因此，C语言函数参数采用自右向左的入栈顺序，主要原因是为了支持可变长参数形式。换句话说，如果不支持这个特色，C语言完全和Pascal一样，采用自左向右的参数入栈方式。

这儿其实还涉及到C语言中调用约定所采用的方式，下面简单的介绍一下：

__stdcall与C调用约定(__cdecl)的区别

C调用约定在返回前,要作一次堆栈平衡,也就是参数入栈了多少字节,就要弹出来多少字节.这样很安全.

有一点需要注意:stdcall调用约定如果采用了不定参数,即VARARG的话,则和C调用约定一样,要由调用者来作堆栈平衡.

（1）_stdcall是Pascal方式清理C方式压栈，通常用于Win32 Api中，函数采用从右到左的压栈方式，自己在退出时清空堆栈。VC将函数编译后会在函数名前面加上下划线前缀，在函数名后加上"@"和参数的字节数。 int f(void *p) -->> _f@4(在外部汇编语言里可以用这个名字引用这个函数)

在WIN32 API中,只有少数几个函数,如wspintf函数是采用C调用约定,其他都是stdcall

（2）C调用约定（即用__cdecl关键字说明）（The C default calling convention）按从右至左的顺序压参数入栈，由调用者把参数弹出栈。对于传送参数的内存栈是由调用者来维护的（正因为如此，实现可变参数vararg的函数(如printf)只能使用该调用约定）。另外，在函数名修饰约定方面也有所不同。 _cdecl是C和C＋＋程序的缺省调用方式。每一个调用它的函数都包含清空堆栈的代码，所以产生的可执行文件大小会比调用_stdcall函数的大。函数采用从右到左的压栈方式。VC将函数编译后会在函数名前面加上下划线前缀。

（3）__fastcall调用的主要特点就是快，因为它是通过寄存器来传送参数的（实际上，它用ECX和EDX传送前两个双字（DWORD）或更小的参数，剩下的参数仍旧自右向左压栈传送，被调用的函数在返回前清理传送参数的内存栈），在函数名修饰约定方面，它和前两者均不同。__fastcall方式的函数采用寄存器传递参数，VC将函数编译后会在函数名前面加上"@"前缀，在函数名后加上"@"和参数的字节数。

（4）thiscall仅仅应用于"C++"成员函数。this指针存放于CX/ECX寄存器中，参数从右到左压。thiscall不是关键词，因此不能被程序员指定。

（5）naked call。当采用1-4的调用约定时，如果必要的话，进入函数时编译器会产生代码来保存ESI，EDI，EBX，EBP寄存器，退出函数时则产生代码恢复这些寄存器的内容。

　　(这些代码称作 prolog and epilog code,一般，ebp,esp的保存是必须的).

　　但是naked call不产生这样的代码。naked call不是类型修饰符，故必须和_declspec共同使用。

　　关键字 __stdcall、__cdecl和__fastcall可以直接加在要输出的函数前。它们对应的命令行参数分别为/Gz、/Gd和/Gr。缺省状态为/Gd，即__cdecl。

　　要完全模仿PASCAL调用约定首先必须使用__stdcall调用约定，至于函数名修饰约定，可以通过其它方法模仿。还有一个值得一提的是WINAPI宏，Windows.h支持该宏，它可以将出函数翻译成适当的调用约定，在WIN32中，它被定义为__stdcall。使用WINAPI宏可以创建自己的APIs。

综上,其实只有PASCAL调用约定的从左到右入栈的.而且PASCAL不能使用不定参数个数,其参数个数是一定的。

简单总结一下上面的几个调用方式：

调用约定	堆栈清除	参数传递
__cdecl	调用者	从右到左,通过堆栈传递
__stdcall	函数体	从右到左,通过堆栈传递
__fastcall	函数体	从右到左,优先使用寄存器(ECX,EDX),然后使用堆栈
thiscall	函数体	this指针默认通过ECX传递,其他参数从右到左入栈

另外一个常见的例子是：

int a = 1;

printf("%d,%d,%d\n", a, a++, a++);

程序输出为：

3, 2, 1

二、双指针

双指针多用于指针交换，可以避免数据复制，提升系统的性能，同时还可以让函数修改指针，例如扩充其大小，指向等

一般指针的指针用作参数，大多用在需要函数改变指针(重新引用变量)而又不能通过返回值传递(例如返回值用于传递其他结果)时。

为了能完全解决动态内存传递的问题,先回顾一下内存管理的知识要点.

（1）内存分配方式有三种：

●从静态存储区域分配。内存在程式编译的时候就已分配好，这块内存在程式的整个运行期间都存在。例如全局变量，static变量。

●在栈上创建。在执行函数时，函数内局部变量的存储单元都能够在栈上创建，函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中，效率很高，但是分配的内存容量有限。

●从堆上分配，亦称动态内存分配。程式在运行的时候用malloc或new申请任意多少的内存，程式员自己负责在何时用free或delete释放内存。动态内存的生存期由我们决定，使用很灵活。

（2）指针的操作流程

申请并初始化或配置为空：int *pInt=NULL;

开辟空间或使其指向对象:pInt=new Int(3);或int i=3;pint=&i;

用指针(更确切地说是操作内存,在使用之前加if(pint!=NULL)或assert(pInt!=NULL)后再使用,以防内存申请失败的情况下使用指针): if(p!=NULL) {use pint};

释放使用完的内存.free(pInt);

置指针为空pInt=NULL;(避免野指针的出现)

(3) 在函数的参数传递中,编译器总是要为函数的每个参数制作临时副本，假如参数为p的话,那么编译器会产生p的副本_p,使_p=p; 假如函数体内的程式修改了_p的内容，就导致参数p的内容作相应的修改。这就是指针能够用作输出参数的原因.

(4)

int **p;

那么p就是二级指针，*p就是一级指针；而**p就是最终存储的数据。

　ｐ　　　　*ｐ　　　**ｐ

－－－　　－－－　　－－－－

｜　｜－＞｜　｜－＞｜　　｜

－－－　　－－－　　｜　　｜

　　　　　　　　　　｜　　｜

　　　　　　　　　　－－－－

现在我就谈谈C指针的比较经常用到的地方：

我们都知道C语言中函数传递参数都是传递"值"的，如下：

void fun(void){     int tmp = 0;     change(tmp);     printf("################ tmp = %d /n");     return ;}void change(int tmp_t){   tmp_t =1;   return;}/*这个时候fun()中打印出来的tmp值还是0，因为我们传递的是“值”，如果你想在函数change()中修改这个tmp的值能在fun()中生效的话，那么就需要用指针来传递了如下：*/void fun(void){     int tmp = 0;     change(&tmp);     printf("################ tmp = %d /n");     return ;}void change(int *tmp_t){   *tmp_t =1;   return;}/*这个时候fun()中打印出来的tmp值就是1了，因为我们此时传进来的是tmp的地址，所以我们在change()中tmp_t就是tmp的地址了，而对于*tmp_t的操作其实就是对tmp的操作了。*//*到这里的时候我们可以试想一下，我们通过传递指针来达到修改一个值的目的，那么当你需要修改一个指针的时候呢，这个时候我们就需要指针的指针了，如下：*/int fun(void){     int *buf ;     int ret ;     ret = mem_init(&buf);     return ret;}int mem_init(int **buf_t){  *buf_t = malloc(100);  return 1;}

通过上面我们可以发现，fun()函数通过调用men_init()函数来实现给buf分配内存空间的目的。首先buf是我们定义的一个指针，&buf则是指向buf的指针(二级指针)，我们通过把&buf传递个men_init()函数，那么此时二级指针buf_t=&buf了，所以说buf_t是指向buf的指针，那么对于*buf_t的操作其实就是对buf的操作了，这样fun()就可以通过men_init()来分配内存了。

（补充一点：对于定义的int **buf_t中，二级指针buf_t=&buf,指向为buf(还是一个指针)，一级指针*buf_t=buf，指向为*buf，

值**buf_t= *buf)

三、函数指针与指针函数

1.指针函数的定义

顾名思义，指针函数即返回指针的函数。其一般定义形式如下：

类型名 *函数名(函数参数表列);

其中，后缀运算符括号“()”表示这是一个函数，其前缀运算符星号“*”表示此函数为指针型函数，其函数值为指针，即它带回来的值的类型为指针，当调用这个函数后，将得到一个“指向返回值为…的指针（地址），“类型名”表示函数返回的指针指向的类型”。

“(函数参数表列)”中的括号为函数调用运算符，在调用语句中，即使函数不带参数，其参数表的一对括号也不能省略。其示例如下：

int *pfun(int, int);

由于“*”的优先级低于“()”的优先级，因而pfun首先和后面的“()”结合，也就意味着，pfun是一个函数。即：

int *(pfun(int, int));

接着再和前面的“*”结合，说明这个函数的返回值是一个指针。由于前面还有一个int，也就是说，pfun是一个返回值为整型指针的函数。

我们不妨来再看一看，指针函数与函数指针有什么区别？

int (*pfun)(int, int);

通过括号强行将pfun首先与“*”结合，也就意味着，pfun是一个指针，接着与后面的“()”结合，说明该指针指向的是一个函数，然后再与前面的int结合，也就是说，该函数的返回值是int。由此可见，pfun是一个指向返回值为int的函数的指针。

虽然它们只有一个括号的差别，但是表示的意义却截然不同。函数指针的本身是一个指针，指针指向的是一个函数。指针函数的本身是一个函数，其函数的返回值是一个指针。

2. 用函数指针作为函数的返回值

在上面提到的指针函数里面，有这样一类函数，它们也返回指针型数据（地址），但是这个指针不是指向int、char之类的基本类型，而是指向函数。对于初学者，别说写出这样的函数声明，就是看到这样的写法也是一头雾水。比如,下面的语句：

int (*ff(int))(int *, int);

我们用上面介绍的方法分析一下，ff首先与后面的“()”结合，即：

int (*(ff(int)))(int *, int); // 用括号将ff(int)再括起来

也就意味着，ff是一个函数。

接着与前面的“*”结合，说明ff函数的返回值是一个指针。然后再与后面的“()”结合，也就是说，该指针指向的是一个函数。

这种写法确实让人非常难懂，以至于一些初学者产生误解，认为写出别人看不懂的代码才能显示自己水平高。而事实上恰好相反，能否写出通俗易懂的代码是衡量程序员是否优秀的标准。一般来说，用typedef关键字会使该声明更简单易懂。在前面我们已经见过：

int (*PF)(int *, int);

也就是说，PF是一个函数指针“变量”。当使用typedef声明后，则PF就成为了一个函数指针“类型”，即：

typedef int (*PF)(int *, int);

这样就定义了返回值的类型。然后，再用PF作为返回值来声明函数:

PF ff(int);

下面将以程序清单1为例，说明用函数指针作为函数的返回值的用法。当程序接收用户输入时，如果用户输入d，则求数组的最大值，如果输入x，则求数组的最小值，如果输入p，则求数组的平均值。

#include
     
      #include 
      
       double GetMin(double *dbData, int iSize)               // 求最小值{       double dbMin;       int i;           assert(iSize>0);       dbMin=dbData[0];       for (i=1; i
       
        dbData[i])         {                    dbMin=dbData[i];              }       }       return dbMin;}double GetMax(double *dbData, int iSize)                 // 求最大值{         double dbMax;         int i;         assert(iSize>0);         dbMax=dbData[0];         for (i=1; i
        
         0);         for (i=0; i