有关问题XYZ的10种语言解决方案（一）之C语言篇

问题XYZ的10种语言解决方案（一）之C语言篇
      写这篇，或者这个系列的无聊博客文章完全是由于昨晚没事瞎想想到的，本来是在思考《Learn you a Hashkell for Great Good》中快速排序的Haskell实现代码，突然想到用其它语言来写写，然后做做对比其实很有意思，于是决定今天起来就做这件事情，由于是在想快速排序时想到的，因此也就将快速排序的实现作为第一篇吧。
      在这个系列的博客文章里（当然也许就这一篇，我不保证，哪天无聊了也许会写第二篇，第三篇......），我会尝试用我接触过的编程语言来解决一系列乱七八糟的问题，并尝试分析比较不同语言的解决方案，主要从表达力和抽象封装度两个方面吧，暂时也就想到这两个方面。当然，我得承认，这10种语言我常用的不过两三种而已，甚至在写这篇博客之前我都没用过D和Lua，但是我对它们都很感兴趣，所以也放在这里，就当练习；而我虽然用过或者知道，但是目前不是很感兴趣的语言，例如汇编语言（实在太低级，就是一堆PUSH、POP、CALL INT了，里面转一圈的话我都不知道怎么写“Hello，World”了）、Basic（没什么兴趣）、C++（杀了我吧，光是虚析构函数、纯虚函数什么的东东就让人晕菜了，更别提编译器私底下自以为是搞的一大坨乱七八糟的东西）等。
      好吧，废话少说，就正式开始吧。在这篇博客里，我们将使用C、Clojure、D、Factor、JavaScript、Groovy、Haskell、Java、Lua、Python这10种编程语言来实现快速排序。
      问题描述：呃，如果你不知道快速排序的话那么还是自己去找本教科书或去google一下吧，我在这里就不赘述了。
      按照字母排序，就先从C开始吧。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include "qsort.h"

void q_sort(int* values)
{
  if(values.length <= 1)
    return;
  size_t length = values.length;
  size_t wl = sizeof(int);
  int* p = malloc(wl * length);
  if(p == NULL) exit(1);
  int* p1 = malloc(wl * length);
  if(p1 == NULL) exit(1);
  int lp = 0, lp1 = 0, i = 1,value = values[0];

  int* cp = p;
  int* cp1 = p1;
  for(; i < length; i++)
  {
    if(values[i] <= value)
    {
      (*p) = values[i];
      p++;
      lp++;
    }
    else
    {
      (*p1) = values[i];
      p1++;
      lp1++;
    }
  }
  values[lp] = value;
  q_sort(cp,lp);
  q_sort(cp1,lp1);
  i = lp;
  while(i > 0) {
    values[i - 1] = cp[i - 1];
    i--;
  }
  i = 1;
  while(lp1 > 0) {
    values[lp + i] = cp1[i - 1];
    lp1--;
    i++;
  }
}

很好，我们的C语言版快速排序完成了，编译吧，blah，blah... ...
什么，出错了？！
In file included from qsort.c:3:
qsort.h:3: error: conflicting types for ‘qsort’
/usr/include/stdlib.h:175: error: previous declaration of ‘qsort’ was here
qsort.c:6: error: conflicting types for ‘qsort’
/usr/include/stdlib.h:175: error: previous declaration of ‘qsort’ was here
qsort.c: In function ‘qsort’:
qsort.c:7: error: request for member ‘length’ in something not a structure or union
... ...
哦，原来已经有qsort的实现了，那就改成q_sort吧，但是，length的调用不合法？哦，我忘记了这是C语言，要自己实现length的有关问题XYZ的10种语言解决方案（一）之C语言篇

，好吧，改写一下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include "qsort.h"

void q_sort(int* values, size_t length)
{
  if(length <= 1)
    return;
  size_t wl = sizeof(int);
  int* p = malloc(wl * length);
  if(p == NULL) exit(1);
  int* p1 = malloc(wl * length);
  if(p1 == NULL) exit(1);
  int lp = 0, lp1 = 0, i = 1,value = values[0];

  int* cp = p;
  int* cp1 = p1;
  for(; i < length; i++)
  {
    if(values[i] <= value)
    {
      (*p) = values[i];
      p++;
      lp++;
    }
    else
    {
      (*p1) = values[i];
      p1++;
      lp1++;
    }
  }
  values[lp] = value;
  q_sort(cp,lp);
  q_sort(cp1,lp1);
  i = lp;
  while(i > 0) {
    values[i - 1] = cp[i - 1];
    i--;
  }
  i = 1;
  while(lp1 > 0) {
    values[lp + i] = cp1[i - 1];
    lp1--;
    i++;
  }
  free(cp);
  cp = NULL;
  free(cp1);
  cp1 = NULL;
}

数一数，总共45行代码，用了我n个小时（n>1，从中我认识到自己是个多么蹩脚的C程序员，虽然和我很久没写C代码也有关系），其中真正和快速排序相关的只有7行左右，其它的全是用来分配内存、移动指针、释放内存之类的操作。经过这个练习，我深深地认识到，学校里用C来教数据结构是件多么愚蠢的事情，我不过是要做个排序，却要写那么多与排序没有直接关系的一大坨代码！用Joel的话来说，这是一种严重的抽象泄漏啊（abstraction leaky），我得不停的在两个不同的抽象层次上进行context switch才能得到我想要的结果。等等，这还只是对整数的排序，浮点数呢？字符串呢？xxyy呢？好吧，撸起袖子继续吧，声明一个能够处理各种能进行排序比较的数据类型的函数的signature吧：
void q_sort(void* values, size_t length, size_t unit, int (*compare)(void* v1, void* v2))
看懂没有？为什么这么声明？哈，C自带的类库里的qsort的声明和这个也差不多，一个一个看看吧：第一个参数，要排序的数组，必不可少，C里面类似泛型的效果只能通过void*来达到了，这样我们可以处理任意类型的数组，哪怕是函数指针呢，呵呵！第二个是要排序的数组的长度，没办法，谁知道这个数组会在哪里结束？只能别人告诉我们了，第三个参数是数据类型的长度，不多解释了，这和C的数据类型的长度在各个平台上都可能不一致有关系，最后一个参数,呃，看着眼花是吧，其实不过是用来对给定数据类型的两个值进行比较的函数指针而已，好吧，我们来实现它吧... ...

void q_sort_g(void* pValue, size_t length, size_t wl, compare cmp)
    {
      if(length <= 1)
      {
        return;
      }
      void* p = malloc(wl * length);
      if(p == NULL) exit(1);
      void* p1 = malloc(wl * length);
      if(p1 == NULL) exit(1);
      int lp = 0, lp1 = 0;
      int i = 1;
      BYTE* b = (BYTE*)pValue;
      BYTE* pivot = b;
      b += wl;
      BYTE* b1 = (BYTE*)p;
      BYTE* b2 = (BYTE*)p1;
      BYTE* b3 = NULL;
      for(; i < length; i++)
      {
        int result = cmp(b,pivot);
        if(result <= 0)
        {
            b3 = (BYTE*)b1;
            b1 += wl;
            lp++;
        }
        else
        {
            b3 = (BYTE*)b2;
            b2 += wl;
            lp1++;
        }
        memcpy(b3,b,wl);
        b += wl;
      }-
      q_sort_g(p,lp,wl,cmp);
      q_sort_g(p1,lp1,wl,cmp);
      memcpy(pValue + lp * wl, pValue, wl);
      memcpy(pValue,p,lp * wl);
      memcpy(pValue + lp * wl + wl,p1,lp1 * wl);
      free(p);
      free(p1);
      p = NULL;
      p1 = NULL;
    }
    
    static int intCmp(void* v1, void* v2)
    {
        int* pV1 = (int*)v1;
        int* pV2 = (int*)v2;
        return (*pV1) - (*pV2);
    }

经过一番和指针的苦战，终于完成了这个泛型版本，从实现的过程来看，可以得出以下几个结论：
1 用C语言的一个最大问题就是需要自己分配和管理内存，实现上面这个快速排序，大概我只有不到10％的时间是在编写实现快速排序的代码，剩下的时间都在和内存分配、指针作斗争，所以Joel（又提到他了，最近在翻他写的东东）曾经写文章说过OO并不能大幅提高程序员的效率，而是自动内存管理，上面的例子虽然简单，但是我想也还是能够证明他的这个观点；
2 C语言是一门通用语言，但是不是“通吃”语言:)，让人烦恼的内存和指针管理其实也正是C语言的强大与灵活之处，如果要解决的问题是和机器密切相关，那么用C来解决是相当舒服的事情，拿到一个指针，想怎么捏就怎么捏，哪怕是传给你一个int型指针，我也可以把它当成char型或者其它任何我想要的类型的指针来玩，呵呵。
C语言的版本就告一段落吧，下面我们该看看Clojure了。

有关问题XYZ的10种语言解决方案（一）之C语言篇

相关推荐