编程之美学习之最长子序列的解法

　　实在愚钝，虽然是以前看过的算法，今天也是折腾了一天才稍微弄懂了一些。特此记下笔记

　　第一次遇到这个问题的场景是猴子摘桃问题，原题如下：

　　小猴子下山，沿着下山的路有一排桃树，每棵树都结了一些桃子。小猴子想摘桃子，但是有一些条件需要遵守，小猴子只能沿着下山的方向走，
不能回头，每颗树最多摘一个，而且一旦摘了一棵树的桃子，就不能再摘比这棵树结的桃子少的树上的桃子。那么小猴子最多能摘到几颗桃子呢？
举例说明，比如有5棵树，分别结了10，4，5，12，8颗桃子，那么小猴子最多能摘3颗桃子，来自于结了4，5，8颗桃子的桃树

　　首先讲第一种解法：

　　要明白这题最关键的一步就是要清楚，不要直接拿数组中的元素一个个去比较，只需要知道，前 i 个元素中最长的递增子序列（LIS）的长度，或者，以第 i 个元素结尾的LIS的长度，第1个元素结尾的LIS的只有他自己一个，所以result[0] = 1，以第2个元素结尾的LIS则之需要和第1个元素peach[0]比较即可，若大于第1个元素，则在result[0]++ 就是他的LIS ，若小于，则同样result[1]=1 ，很明显，第i个元素结尾的LIS起码都是1。。以后的任意i值，都可以依次类推获得到结果。以下是该方法的算法代码：

/*小猴子下山，沿着下山的路有一排桃树，每棵树都结了一些桃子。小猴子想摘桃子，但是有一些条件需要遵守，小猴子只能沿着下山的方向走，
    不能回头，每颗树最多摘一个，而且一旦摘了一棵树的桃子，就不能再摘比这棵树结的桃子少的树上的桃子。那么小猴子最多能摘到几颗桃子呢？
    举例说明，比如有5棵树，分别结了10，4，5，12，8颗桃子，那么小猴子最多能摘3颗桃子，来自于结了4，5，8颗桃子的桃树。*/
    int peaches[] = new int[]{4,4,5,2,3,156,15,6156,156,165,15,6};
    @Test
    public void test222(){
        /*Scanner in = new Scanner(System.in );
        System.out.print("请输入数的颗树：");
        int trees = Integer.parseInt(in.nextLine().trim());
        peaches = new int[trees];
        for (int i = 0; i < peaches.length; i++) {
            peaches[i] = Integer.parseInt(in.nextLine().trim());
        }*/
        printArray(peaches);
        System.out.println(pick(peaches));
        System.out.println(findMax2(peaches));

    }

/*    5
    2
    3
    156
    15
    6156
    156
    165
    15
    6*/
    // 思路：求出以位置所有 以 peach[i](存入result[i]中)结尾的最长递增子序列的长度--->根据每个 result[0~j],
    // 拿peach[i]和peach[j]比较，如果peach[i]>peach[j]，且result[j]+1>result[i]，很明显，就该把result[i]值加1
    // 所以，这种方法起码能找出一个最长序列，有时候可以找出多条，但有个条件，结尾的peach[i] 一定不相同
    int pick(int[] peaches) {
        int max = 1;
        int length = peaches.length;
        // sequences存储桃树peach[i]每个位置，最长序列的每个元素。
        List<ArrayList<Integer>> sequences = new ArrayList<ArrayList<Integer>>();
        
        // 记录每个位置的最长递增子序列的长度
        int result[] = new int[length];
        for (int i = 0; i < length; i++) {
            result[i] = 1;
            ArrayList<Integer> list= new ArrayList<Integer>();
            // 相当于每个位置初始化设置result[i]=1并且把自己放进去  ---->为了存好没进入循环的以及进入循环没进入关键判断的元素
            list.add(peaches[i]);
            for (int j = 0; j < i; j++) {
                //必須新new一個，每一次循环，都是一次新的比较和 , 即和result[0 ~ i-1]的比较
                // 不能是clear，因为这个newL是被引用的，所以，不能修改原对象的值
                ArrayList<Integer> newL = new ArrayList<Integer>();
                //这里也要初始化一次 ----> 为了进入判断后失去了本身元素，导致后面连锁的错误
                newL.add(peaches[i]);
                //关键判断： 如果是i位置大于j位置，且j位置的最长递增子序列的长度+1长于目前i位置的最长递增子序列的长度，则更新i位置的最长递增子序列
                if (peaches[j] <= peaches[i] && result[j] + 1 > result[i]){
                    result[i] = result[j] + 1;
                    //j为此时比较的位置上最大的序列集合存储的索引
                    newL.addAll(sequences.get(j));
                    list = newL;
                }
            }
            sequences.add(list);
            System.out.println(sequences);
        }
        for (int i : result)
            max = i > max ? i : max;
            
        System.out.println(sequences);
        System.out.println(Arrays.toString(result));
       /* for(ArrayList<Integer> l : sequences){
            // 
            if(l.size() >= max){
                System.out.println(l);
            }
        }   */
         
        return max;
    }
    /*
     *　第二种方法的思路很简单，即开辟一段新的空间存储相应长度LCS中的最大元素的最小元素，举个例子：1，2，5，4 ...  当扫描到5(i=2)的时候，maxV[3] = 5 , result[2] = 3 
     * ,maxV[3] 即指的是 长度为3的LCS中最大元素的最小元素，所以当扫描到3的时候，maxV[3]就更新为4了 ， 因为 5>4 ，且他们的result的长度都为3 这样子，就可以直接比较当前的peach[i]和
     * nMaxResult就可以算出当前i的result
     */
    // 方法二
    private int findMax2(int [] peaches){
        int [] maxV = new int[peaches.length];
        maxV[1] = peaches[0];
        maxV[0] = -1;
        int [] result = new int[peaches.length];
        for(int i=0 ; i<result.length ; i++){
            result[i] = 1;
        }
        // 最长子序列变量
        int nMaxResult = 1;
        for(int i=1 ; i<peaches.length ; i++){
            int j;
            //只要中一个小于peaches[i]，更新i的最长子序列的长度，退出遍历
            //这里可以换成二分查找
             for(j = nMaxResult ; j>=1 ; j--){
            //for(j = result[i-1] ; j>=1 ; j--){
                if(peaches[i] >= maxV[j] && result[i]<(j+1)){
                    result[i] = j+1;
                    break;
                }
            }
            if(result[i] > nMaxResult){
                nMaxResult = result[i];
                maxV[result[i]] = peaches[i];
            }else if( maxV[j]<peaches[i] 
                    &&peaches[i]<maxV[j+1] ){
                // 持续更新LCS中最大元素的最小元素 ， 保证后面的比较是正确的
                // 比如 8 9 1 2 3 走完前两步后maxV[1] = 8 , maxV[2] = 9 再走完两部后maxV[1]=1 maxV[2]=2，
                // 这样就保证了当扫描第3的时候能够匹配成功，这就能够是LIS尽可能长了。
                maxV[result[i]] = peaches[i];
            }
        }
        System.out.println(Arrays.toString(result));
        return nMaxResult;
    }

　　以上多了我自己添加了打印序列的代码，同学们也可以自己屏蔽掉（想看的话，是从后往前看哦，我懒得改了）。同时我也偷了个懒，顺便把第二种发放贴了上去了。在这里继续介绍下去...

　　第二种方法的思路很简单，即开辟一段新的空间存储相应长度LCS中的最大元素的最小元素，举个例子：1，2，5，4 ... 当扫描到5(i=2)的时候，maxV[3] = 5 , LIS[2] = 3 ,maxV[3] 即指的是长度为3的LCS中最大元素的最小元素，所以当扫描到3的时候，maxV[3]就更新为4了，因为 5>4 ，且他们的LIS的长度都为3

　　这样子，就可以直接比较当前的peach[i]和nMaxLIS就可以算出当前i的LIS

　　这样做是有原因的！其实现在这么做的话，效率还是n2 ，其实还有第三种代码，因为maxV中的记录肯定是满足maxV[1] < maxV[2] <maxV[3] ....细心的同学可以已经发现，这种规律可以用二分查找方法取代遍历这样就可以把效率提高到 nlog2n （二分查找的效率是log2n）。依据单调递增，将上面便利部分，做以下改动

编程之美学习之最长子序列的解法

　　最后将上面的代码换成二分查找去匹配，效率应该会更有改善，有兴趣的同学可以尝试

　　以前纯属个人观点，如有错误还请大佬们海涵，还请大佬们指点

以下来自知乎，拿最长子序列做例子学习动态规划的。

作者：徐凯强 Andy
链接：https://www.zhihu.com/question/23995189/answer/35324479
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

动态规划中递推式的求解方法不是动态规划的本质。

我曾经作为省队成员参加过NOI，保送之后也给学校参加NOIP的同学多次讲过动态规划，我试着讲一下我理解的动态规划，争取深入浅出。希望你看了我的答案，能够喜欢上动态规划。

0. 动态规划的本质，是对问题状态的定义和状态转移方程的定义。
引自*

dynamic programming is a method for solving a complex problem by breaking it down into a collection of simpler subproblems.

动态规划是通过拆分问题，定义问题状态和状态之间的关系，使得问题能够以递推（或者说分治）的方式去解决。
本题下的其他答案，大多都是在说递推的求解方法，但如何拆分问题，才是动态规划的核心。
而拆分问题，靠的就是状态的定义和状态转移方程的定义。

1. 什么是状态的定义？

首先想说大家千万不要被下面的数学式吓到，这里只涉及到了函数相关的知识。
我们先来看一个动态规划的教学必备题：

给定一个数列，长度为N，
求这个数列的最长上升（递增）子数列（LIS）的长度.
以
1 7 2 8 3 4
为例。
这个数列的最长递增子数列是 1 2 3 4，长度为4；
次长的长度为3，包括 1 7 8; 1 2 3 等.

要解决这个问题，我们首先要定义这个问题和这个问题的子问题。
有人可能会问了，题目都已经在这了，我们还需定义这个问题吗？需要，原因就是这个问题在字面上看，找不出子问题，而没有子问题，这个题目就没办法解决。

所以我们来重新定义这个问题：

给定一个数列，长度为N，
设为：以数列中第k项结尾的最长递增子序列的长度.
求中的最大值.

显然，这个新问题与原问题等价。
而对于编程之美学习之最长子序列的解法来讲，都是的子问题：因为以第k项结尾的最长递增子序列（下称LIS），包含着以第中某项结尾的LIS。

上述的新问题编程之美学习之最长子序列的解法也可以叫做状态，定义中的“为数列中第k项结尾的LIS的长度”，就叫做对状态的定义。
之所以把做“状态”而不是“问题” ，一是因为避免跟原问题中“问题”混淆，二是因为这个新问题是数学化定义的。

对状态的定义只有一种吗？当然不是。
我们甚至可以二维的，以完全不同的视角定义这个问题：

给定一个数列，长度为N，
设为：
在前i项中的，长度为k的最长递增子序列中，最后一位的最小值. .
若在前i项中，不存在长度为k的最长递增子序列，则为正无穷.
求最大的x，使得不为正无穷。

这个新定义与原问题的等价性也不难证明，请读者体会一下。
上述的编程之美学习之最长子序列的解法就是状态，定义中的“为：在前i项中，长度为k的最长递增子序列中，最后一位的最小值”就是对状态的定义。

2. 什么是状态转移方程？
上述状态定义好之后，状态和状态之间的关系式，就叫做状态转移方程。

比如，对于LIS问题，我们的第一种定义：

设为：以数列中第k项结尾的最长递增子序列的长度.

设A为题中数列，状态转移方程为：

（根据状态定义导出边界情况）

用文字解释一下是：
以第k项结尾的LIS的长度是：保证第i项比第k项小的情况下，以第i项结尾的LIS长度加一的最大值，取遍i的所有值（i小于k）。

第二种定义：

设为：在数列前i项中，长度为k的递增子序列中，最后一位的最小值

设A为题中数列，状态转移方程为：

若则
否则：

（边界情况需要分类讨论较多，在此不列出，需要根据状态定义导出边界情况。）
大家套着定义读一下公式就可以了，应该不难理解，就是有点绕。

这里可以看出，这里的状态转移方程，就是定义了问题和子问题之间的关系。
可以看出，状态转移方程就是带有条件的递推式。

3. 动态规划迷思
本题下其他用户的回答跟动态规划都有或多或少的联系，我也讲一下与本答案的联系。

a. “缓存”，“重叠子问题”，“记忆化”：
这三个名词，都是在阐述递推式求解的技巧。以Fibonacci数列为例，计算第100项的时候，需要计算第99项和98项；在计算第101项的时候，需要第100项和第99项，这时候你还需要重新计算第99项吗？不需要，你只需要在第一次计算的时候把它记下来就可以了。
上述的需要再次计算的“第99项”，就叫“重叠子问题”。如果没有计算过，就按照递推式计算，如果计算过，直接使用，就像“缓存”一样，这种方法，叫做“记忆化”，这是递推式求解的技巧。这种技巧，通俗的说叫“花费空间来节省时间”。都不是动态规划的本质，不是动态规划的核心。

b. “递归”：
递归是递推式求解的方法，连技巧都算不上。

c. "无后效性"，“最优子结构”：
上述的状态转移方程中，等式右边不会用到下标大于左边i或者k的值，这是"无后效性"的通俗上的数学定义，符合这种定义的状态定义，我们可以说它具有“最优子结构”的性质，在动态规划中我们要做的，就是找到这种“最优子结构”。
在对状态和状态转移方程的定义过程中，满足“最优子结构”是一个隐含的条件（否则根本定义不出来）。对状态和“最优子结构”的关系的进一步解释，什么是动态规划？动态规划的意义是什么？ - 王勐的回答写的很好，大家可以去读一下。

需要注意的是，一个问题可能有多种不同的状态定义和状态转移方程定义，存在一个有后效性的定义，不代表该问题不适用动态规划。这也是其他几个答案中出现的逻辑误区：
动态规划方法要寻找符合“最优子结构“的状态和状态转移方程的定义，在找到之后，这个问题就可以以“记忆化地求解递推式”的方法来解决。而寻找到的定义，才是动态规划的本质。

有位答主说：

分治在求解每个子问题的时候，都要进行一遍计算
动态规划则存储了子问题的结果，查表时间为常数

这就像说多加辣椒的菜就叫川菜，多加酱油的菜就叫鲁菜一样，是存在误解的。

文艺的说，动态规划是寻找一种对问题的观察角度，让问题能够以递推（或者说分治）的方式去解决。寻找看问题的角度，才是动态规划中最耀眼的宝石！（大雾）

编程之美学习之最长子序列的解法

相关推荐