部分转载[C#性能优化实践]

部分转载[C#性能优化实践]

全文出处:http://www.infoq.com/cn/articles/C-sharp-performance-optimization

1.性能

   主要指两个方面:内存消耗和执行速度。性能优化简而言之,就是在不影响系统运行正确性的前提下,使之运行地更快,完成特定功能所需的时间更短。

2.理解瓶颈

   99%的性能消耗是由于1%的代码造成的。大部分性能优化都是针对这1%的瓶颈代码进行的。具体实施也就分为两步:“发现瓶颈”和“消除瓶颈”。

3.切忌过度

   性能优化本身是有成本的。这个成本不单单体现在做性能优化所付出的工作量,还包括为性能优化而写出复杂的代码导致额外的维护成本,比如引入新的Bug,额外的内存开销等。性能优化常常需要在收益和成本之间做出权衡。

4.如何发现性能瓶颈

   性能优化的第一步是发现性能瓶颈,下面是一些定位性能瓶颈的实践。

   A.如何获取内存消耗

      以下代码可以获取某个操作的内存消耗:

long start = GC.GetTotalMemory(true);
// 在这里写需要被测试内存消耗的代码,例如,创建一个GcMultiRow
var gcMulitRow1 = new GcMultiRow();
GC.Collect();
// 确保所有内存都被GC回收
GC.WaitForFullGCComplete();
long end = GC.GetTotalMemory(true);
long useMemory = end - start; 

    B.如何获取时间消耗

       以下代码可以获取某个操作时间消耗:

System.Diagnostics.Stopwatch watch = new System.Diagnostics.Stopwatch();
watch.Start();
for (int i = 0; i < 1000; i++)
{
    gcMultiRow1.Sort();
}
watch.Stop();
var useTime = (double)watch.ElapsedMilliseconds / 1000;

     ----为了获得更加稳定的时间消耗,这里把一个操作循环执行了1000次,取时间消耗的平均值以排除不稳定数据。

5.性能优化的方法和技巧

  A.优化程序结构

  B.缓存

    缓存(Cache)是性能优化中最常用的手段,针对需要频繁的获取一些数据,同时每次获取数据需要的时间比较长的场景。如果使用了缓存的优化方法,需要特别注意缓存数据的同步:如果真实的数据发生了变化,应该及时的清除缓存数据,确保不会因为缓存而使用了错误的数据。使用缓存的情况比较多, 最简单的情况就是缓存到一个Field或临时变量里。

forint i = 0; i < gcMultiRow.RowCount; i++)
{ 
// Do something; 
} 

    以上代码一般情况下是没有问题的,但是,如果GcMultiRow的行数比较大。而RowCount属性的取值又比较慢的时候,就需要使用缓存来做性能优化。

int rowCount = gcMultiRow.RowCount;
for (int i = 0; i < rowCount; i++)
{
// Do something;
}

   C.延迟加载

      大多时候,对于创建需要花费较长时间的对象,往往并不是所有的场景下都需要使用。这时,使用懒构造的方法可以有效提高程序启动性能。

      举例来说,对象A需要内部创建对象B。对象B的构造时间比较长。 一般做法:

public class A
{
    public B _b = new B();
}

      一般做法下,由于构造对象A的同时要构造对象B,导致A的构造速度也变慢了。

      优化做法:

public class A
{
    private B _b;
    public B BProperty
    {
        get
        {
            if(_b == null)
            {
                _b = new B();
            }
            return _b;
        }
    }
}

      优化后,构造A的时候就不需要创建B对象,有效的提高了A的构造性能。

  D.优化算法

  E.正确的使用既有数据结构

     .NET平台有很多现成的数据结构。我们应该了解这些数据结构,提升我们程序的性能。

    例如:

            1. String的加运算符和StringBuilder:

                字符串的操作是我们经常遇到的基本操作之一。 我们经常会写这样的代码 string str = str1 + str2。当操作的字符串很少的时候,这样的操作没有问题。但是如果大量操作的时候(例如文本文件的Save/Load, Asp.net的Render),这样做就会带来严重的性能问题。这时,我们就应该用StringBuilder来代替string的加操作。

           2. Dictionary 和 List:

               Dictionary和List是最常用的两种集合类。选择正确的集合类可以很大的提升程序的性能。为了做出正确的选择,我们应该对Dictionary 和List的各种操作的性能比较了解。 下表中粗略的列出了两种数据结构的性能比较。

操作                   List         Dictionary

索引                   快            慢

Find(Contains)       慢            快

Add                   快            慢

Insert                慢            快

Remove                慢            快

             3.TryGetValue: 对于Dictionary的取值,比较直接的方法是如下代码:

if(_dic.ContainKey("Key")
{
    return _dic["Key"];
}      

              当需要大量取值的时候,这样的取法会带来性能问题。优化方法如下

object value;
if(_dic.TryGetValue("Key", out value))
{
return value;
}

             后一种用法要比前一种用法取值性能提高一倍。

             4. 为Dictionary选择合适的Key:

                 Dictionary的取值性能很大情况下取决于做Key的对象的Equals和GetHashCode两个方法的性能。如果可以的话,使用Int做Key性能最好。如果是一个自定义的Class做Key的话,最好保证以下两点:

                1)不同对象的GetHashCode重复率低。

                2)GetHashCode和Equals方法简单,效率高。

             5. List的Sort和BinarySearch性能很好,如果能满足功能需求,推荐直接使用。

List<int> list = new List<int>{3, 10, 15};

 

list.BinarySearch(10); // 对于存在的值,结果是1

 

list.BinarySearch(8); // 对于不存在的值,会使用负数表示位置,

 

// 如查找8时,结果是-2, 查找0结果是-1,查找100结果是-4.