二维数组用vector容器,实现Strassen算法,效率很低!help。该怎么解决

二维数组用vector容器,实现Strassen算法,效率很低!help。。
matrix.h,
C/C++ code
/*
本文件定义了CMatrix类,使用STL模板容器 vector 来存储矩阵,可以实现任意 n 的Strassen算法矩阵相乘
当 n 为奇数时,调用普通矩阵算法。
example:
CMatrix A(8),B(*),C(8);
A.Trun_Random();
B.Trun_Random();
C = A*B;
cout<<C;
*/


#ifndef matrix_h_
#define matrix_h_
#include<vector>
#include<iostream>
#include  <time.h> 
using namespace std;


class CMatrix{
    //运算符重载
    friend ostream& operator << (ostream &out,CMatrix& M);
    friend CMatrix& operator + (CMatrix& M1,CMatrix& M2);
    friend CMatrix& operator - (CMatrix& M1,CMatrix& M2);
    friend CMatrix& operator * (CMatrix& M1,CMatrix& M2);  //Strassen算法矩阵相乘
public:
    int N;
    vector< vector<int> > A;  //二维
public:
    CMatrix(int n); //构造,生成n阶二维数组,元素值都为1
    CMatrix(int n,int a);  //构造,生成n阶二维数组,元素值都为a;
    ~CMatrix(){ };
    CMatrix(CMatrix& M2);

    CMatrix& operator = (CMatrix& M2); //重载“=”

    void Trun_Random();   //使数组的元素全部变成随机数,0~9
    void Union(CMatrix& A11,CMatrix& A12,CMatrix& A21,CMatrix& A22);//联合4个小二维数组
    CMatrix& normalMutil(CMatrix& M2);   //普通矩阵乘法
};

#endif






------解决方案--------------------
什么编译器,谈STL的效率别用VC6……
------解决方案--------------------
vector的随机存取效率应该还是很高的,
但你要注意的是,如果频繁改变2维vector的大小,那么效率会是一个噩梦
因为如果resize造成重新申请内存的话,会把里面所有的vector复制一遍
------解决方案--------------------
Boost::uBLAs库
这个库的开发由一系列的类似的库来指导:

由Jack Dongarra等人开发的BLAS 库。 
由Todd Veldhuizen开发的Blitz++ 库。 
由Scott Haney 等人开发的POOMA 库。 
由Jeremy Siek等人开发的MTL 库。 

BLAS 似乎是基本的线性代数使用最广泛的库,所以它可以被称作de-facto standard。它的接口是面向过程的(procedural),单独的函数是对一些基本的线性代数运算的抽象。由于它是使用Fortran语言实现以及它所进行的优化,BLAS似乎也是现在最快的库之一。因为我无决定以面向对象的方式来设计和实现我们的类库,所以技术方式上有显著的不同。然而,每个人都可以使用我们的库中的运算符表达所有的BLAS抽象并对效率进行比较。

Blitz++ 是一个使用C++实现的让人映象深刻的(impressive)库。它的主要设计似乎是面向多维数组以及包括张量(tensor)的相关的运算符。Blitz++库的作者声称由于它的实现技术使用表达式模板(expression template)和模板元编程技术(template metaprogram),他的库的性能与对应的Fortan代码的性能相当或更好一些。然而我们有一些理由来开发一个我们自己设计和实现的方法。我们不知道是否有人使用Blitz++库来实现传统的线性代数运算。我们同样也假定由于Blitz++库所使用的实现风格(idioms),即使在今天也需要最高级的C++编译器技术。另一方面,Blitz++库也使用我们相信,使用表达式模板技术(expression templates)是将抽象惩罚降低到一个可接受限度的必需的技术方法。

POOMA 的设计目标似乎是在许多部分对Blitz++库的大量部分进行并行计算。它从偏微分方程和理论物理领域中提取类来扩展Blitz++的概念。这种实现支持并行体系结构(parallel architectures)。

MTL 是另一个使用C++来支持基本的线性代数运算的类库。我们共同的观点是线性代数库应当提供与BLAS库相应的功能。另一方面,我们认为C++标准库的概念并没有支持所需要的数值计算的概念要求。另一个区别是MTL库当前并没有使用表达式模板技术(expression templates)。这可能导致两个问题中的一个:可能存在表现能力缺失或可能的性能损失。