Java性能优化系列之二-程序优化

Java性能优化系列之二--程序优化

常用的程序设计优化技巧：

1、字符串优化处理

（1）String类的特点：不变性、针对常量池的优化（String.intern()方法的意义）

（2）subString方法的内存泄漏:

（3）字符串分割和查找不要使用split函数，效率低，而是使用StringTokenizer或者indexOf结合subString()函数完成分割。

（4）用charAt（）方法代替startWith（）方法。

（5）对于静态字符串或者变量字符串的连接操作，Java在编译的时候会进行彻底的优化，将多个连接操作的字符串在编译时合成一个单独的字符串，而不是生成大量的String实例。只生成一个对象。

（6）在无需考虑线程安全情况下尽量使用StringBuilder。

（7）StringBuffer和StringBuilder初始化的时候都可以设置一个初始值，默认是16B。如果字符串的长度大于16B的时候，则需要进行扩容。扩容策略是将原有的容量大小翻倍，以新的容量申请内存空间，建立char数组，然后将数组中的内容复制到这个新的数组中，使用Arrays.copyOf()函数。因此，如果能预先评估StringBuilder的大小，则可以节省这些复制操作，从而提高系统的性能。

2、List接口

（1）ArrayList和Vector的区别：它们几乎使用了相同的算法，它们的唯一区别是对多线程的支持。ArrayList是不安全的，而Vector是线程安全的。

（2）LinkedList和ArrayList的区别：

|---1、linkedList采用链表实现，适合于数据删除和插入非常频繁的情况，不适合随机访问。

|---2、ArrayList采用数组实现，适用于随机查找和顺序读的情况，不适合删除和插入数据非常频繁的场景。

（3）基于数组的List都会有一个容量参数。当ArrayList所存储的元素容量超过其已有大小的时候就会进行扩容，数组的扩容会导致整个数组进行一次内存复制。因此合理的数组大小会减小数组扩容的次数从而提高系统性能。

（4）遍历列表的时候尽量使用迭代器，速度块。

2、Map接口：

（1）HashMap的实现原理：简单的说，HashMap就是将key做hash算法，然后将hash值映射到内存地址，直接取得key所对应的数据。在HashMap中，底层数据结构使用的是数组，所谓的内存地址指的是数组的下标索引。

（2）容量参数与扩容：默认情况下，hashmap的初始容量为16，负载因子为0.75，也就是说当hashmap的实际容量达到了初始容量*负载因子（hashmap内部维护的一个threshold值）的时候，hashmap就会进行扩容。在扩容时，会遍历整个hashmap，因此应该设置合理的初始大小和负载因子，可以减小hashmap扩容的次数。

（3）LinkedHashMap--有序的HashMap：HashMap的最大缺点是其无序性，被存入到Hashmap 中的元素，在遍历HashMap的时候，其输出不一定按照输入的顺序，而是HashMap会根据hash算法设定一个查找高效的顺序。如果希望保存输入顺序，则需要使用LinkedHashMap。LinkedHashmap在内部又增加了一个链表，用于保存元素的顺序。

（4）LinkedList可以提供两种类型的顺序：一个是元素插入时候的顺序，一个是最近访问的顺序。注意：LinkedHashMap在迭代过程中，如果设置为按照最后访问时间进行排序，即：每当使用get()方法访问某个元素时，该元素便会移动到链表的尾端。但是这个时候会出现异常，因此，LinkedHashMap工作在这种模式的时候，不能在迭代器中使用get()操作。

（5）关于ConcurrentModificationException：该异常一般会在集合迭代过程中被修改时抛出。因此，不要在迭代器模式中修改集合的结构。这个特性适合于所有的集合类，包括HashMap、Vector、ArrayList等。

（6）TreeMap--如果要对元素进行排序，则使用TreeMap对key实现自定义排序，有两种方式：在TreeMap的构造函数中注入一个Comparator或者使用一个实现了Comparable的key。

（7）如果需要将排序功能加入HashMap，最好是使用Treemap而不是在应用程序自定义排序。

（8）HashMap基于Hash表实现，TreeMap基于红黑树实现。

3、Map和Set的关系：

（1）所有Set的实现都只是对应的Map的一种封装，其内部维护一个Map对象。即：Set只是相应的Map的Value是一种特殊的表现形式的一种特例。

（2）Set主要有三种实现类：HashSet、LinkedHashSet、TreeSet。其中HashSet是基于Hash的快速元素插入，元素之间无序。LinkedHashSet同时维护着元素插入顺序，遍历集合的时候，总是按照先进先出的顺序排序。TreeSet是基于红黑树的实现，有着高效的基于元素Key的排序算法。

4、优化集合访问代码：

（1）、分离循环中被重复调用的代码：例如，for循环中使用集合的size()函数，则不应该把这个函数的调用放到循环中，而是放到循环外边、

（2）、省略相同的操作：

5、RandomAccess接口：通过RandomAccess可知道List是否支持随机快速访问。同时，如果应用程序需要通过索引下标对List做随机访问，尽量buyaoshiyongLinkedList，ArrayList或者Vector可以。

6、JavaNIO的特性：

1、为所有的原始类型提供Buffer支持。

2、使用Java.nio.charset.Charset作为字符编码解码解决方案。

3、增加通道抽象代替原有的IO流抽象。

4、支持锁和内存映射文件的文件访问接口。

5、提供基于Selector的异步网络IO。

7、Java中NIO的使用。Channel是一个双向通道，即可读也可写。应用程序不能直接操作Channel，必须借助于Buffer。例如读数据的时候，必须把数据从通道读入到缓冲区，然后在缓冲区中进行读取。以文件读取为例，首先通过文件输入流获得文件通道，然后把文件通道的内容读入到缓冲区中，然后就可以对缓冲区操作。

8、Buffer的基本原理：

1、Buffer的创建：Buffer的静态allocate(int size)方法或者Buffer.wrap(byte[]src)。

2、Buffer的工作原理：三个变量：position，代表当前缓冲区的位置，写缓冲区的时候，将从position的下一个位置写数据。Capacity，代表缓冲区的总容量上限。Limit，缓冲区的实际上限，也就是说，读数据的时候，数据即是从position到limit之间的数据

3、flip操作：limit=position,position=0,一般是在读写切换的时候使用。写完数据之后，需要限定下有效数据范围，才能读数据；

4、clear操作：position-0，limit=capacity.。为重新写入缓冲区做准备。

5、rewind操作：position=0，为读取缓冲区中有效数据做准备，一半limit已经被合理设置。

9、读写缓冲区：

1、public byte get()：顺序读取缓冲区的一个字节，position会加一

2、public Buffer get(byte[]dst):将缓冲区中的数据读入到数组dst中，并适当的移动position

3、public byte get(int index)：得到第index个字节，但不移动posoiion

4、public ByteBuffer put(byte b)：将字节b放入到缓冲区中，并移动position

5、public ByteBuffer put(int index,byte b)：将字节b放到缓冲区的index位位置

6、pubglic final ByteBuffer(byte[]src)：将字节数组src放到缓冲区中。

10、标志缓冲区：类似于一个书签的功能，在数据的处理过程中，可随时记录当前位置。然后在任意时刻，回到这个位置。Mark用于记录当前位置，reset用于恢复到mark所在的位置、

11、复制缓冲区：使用Buffer的duplicate方法可以复制一个缓冲区，副本缓冲区和原缓冲区共享一份空间但是有有着独立的position、capacity和limit值。

20、缓冲区分片：缓冲区分片使用slice方法实现。它将在现有的缓冲区中，创建的子缓冲区。子缓冲区和父缓冲区共享数据。这个方法有助于将系统模块化。缓冲区切片可以将一个大缓冲区进行分割处理，得到的子缓冲区都具有缓冲的缓冲区模型结构；因此。这个操作有助于系统的模块化。

12、只读缓冲区：只读缓冲区可以保证核心数据的安全，如果不希望数据被随意篡改，返回一个只读缓冲区是很有帮助的。

13、文件映射到内存：NIO提供了一种将文件映射到内存的方法进行IO操作，这种方法比基于流IO快很多。这个操作主要由FileChanne.map()操作。使用文件内存的方式，将文本通过FileChannel映射到内存中。然后从内存中读取数据。同时，通过修改Buffer,将对内存中数据的修改写到对应的硬盘文件中。

14、处理结构化数据：散射和聚集。散射就是将数据读入到一组bytebuffer中，而聚集正好相反。通过ScatteringByteChannel和GatheringByteChannel可以简化对结构数据的操作。

15、直接内存访问：DirectBuffer直接分配在物理内存中，并不占用对空间，因此也不受对空间限制。DirectBuffer的读写操作比普通Buffer块，因为DirectBuffer直接操纵的就是内核缓冲区。

16、引用类型：强、软、若、虚四种引用类型。

WeakHashMap：是弱引用的一中典型应用，它使用弱引用作为内部数据的存储方案。可以作为简单的缓存表解决方案。

如果在系统中，需要一张很大的Map表，Map中的表项作为缓存之用。这也意味着即使没能从该Map中取得相应地数据，系统也可以通过选项方案获取这些数据，虽然这样会消耗更多的时间，但是不影响系统的正常运行。这个时候，使用WeakHashMap是最合适的。因为WeakHashMap会在系统内存范围内，保存所有表项，而一旦内存不够，在GC时，没有被引用的又会很快被清除掉，避免系统内存溢出。

17、有助于改善系统性能的技巧：

1、慎用异常：for循环中使用try-catch会大大降低系统性能

2、使用局部变量：局部变量的访问速度远远高于类的静态变量的访问速度，因为类的变量是存在在堆空间中的。

3、位运算代替乘除法：右移代表除以二、左移代表乘以二。

4、有的时候考虑是否可以使用数组代替位运算。

5、一维数组代替二维数组。

6、提取表达式：尽可能让程序少做重复的计算，尤其要关注在循环体的代码，从循环提中提取重复的代码可以有效的提升系统性能。

参考书籍：

Java程序性能优化-让你的Java程序更块、更稳定葛一鸣

Effctive java 第二版

Java性能优化系列之二-程序优化

相关推荐