动态规划:最长上升子序列、最长公共子序列

一、基本概念

在介绍最长公共公共子序列之前,先说一下这里的基本概念。

1.串和序列:

  串: 串是一个连续的部分。比如在12345这个数列中,123这个是一个串,45也是一个串。而135不是一个串。

  序列:子序列则是从不改变序列的顺序,而从序列中去掉任意的元素而获得新的序列。还是12345这个数列,135是一个序列,24也是一个序列,当然123也是一个序列。

  异同:串中字符的位置必须是连续的,序列则可以不必连续。

2.子串和子序列

  就是一个数列或者字符列的一部分。子串就是位置连续的一部分,子序列就是不必连续的一部分。

3.最长上升子序列(LIS)

  就是在子序列的基础上添加了两个定语。上升就是按一个顺序(升序、降序、非上升、非下降等),最长就是最长的一部分。

  最长上升子序列就是指一个序列中最长的单调递增的子序列

  比如在1352496这个序列中,546(随便举得例子)是一个子序列,但不是上升子序列。3 5 6(也是随便举得例子)就是一个上升子序列。

  但是不是最长的,1 3 4 9则是一个最长的上升子序列。同样1 2 4 6也是一个最长的上升子序列。所以最长上升子序列并不一定是唯一的。

4.最长公共子序列(LCS)

  有了公共这个定语,那么至少就是在两个数列或者字符列中找最长的公共的部分。就是说一个数列 ,如果分别是两个或多个已知数列的子序列,且是所有符合此条件序列中最长的,则称为是最长公共子序列。

  比如在1352496和382546这两个序列中,3 4是公共子序列,2 4 也是公共子序列。但不是最长的,最长的公共子序列为3 2 4 6。

二、最长上升子序列

    ①算法1(n^2)

    我们依次遍历整个序列,每一次求出从第一个数到当前这个数的最长上升子序列,直至遍历到最后一个数字为止

    然后再取dp数组里最大的那个即为整个序列的最长上升子序列。

    我们用dp[i]来存放序列1-i的最长上升子序列的长度,那么dp[i]=max(dp[j])+1,(j∈[1, i-1]);

    显然dp[1]=1,我们从i=2开始遍历后面的元素即可。

  模板:

#include<stdio.h>
int main()
{
    int n,i,j,num,h[1000],max[1000];
    while(~scanf("%d",&n))
    {
        num=1;
        for(i=0; i<n; ++i)
        {
            scanf("%d",&h[i]);
            max[i]=1;
        }
        for(i=1; i<n; ++i)/*求最长上升子序列*/
            for(j=0; j<i; ++j)
            {
                if(h[j]<h[i]&&max[j]+1>max[i])/*用两个数组,方便理解,如果只是求最长上升子序列,可以直接max[j]和num比较取较大值*/
                    max[i]=max[j]+1;
                if(num<max[i])
                    num=max[i];
            }
        printf("%d
",num);
    }
    return 0;
}

  ②算法2(nlogn):

    维护一个一维数组c,并且这个数组是动态扩展的,初始大小为1,

    c[i]表示最长上升子序列长度是i的所有子串中末尾最小的那个数,根据这个数字,我们可以比较知道,

    只要当前考察的这个数比c[i]大,那么当前这个数一定能通过c[i]构成一个长度为i+1的上升子序列。

    当然我们希望在C数组中找一个尽量靠后的数字,这样我们得到的上升子串的长度最长,查找的时候使用二分搜索,这样时间复杂度便下降了。

   举例说明一下(复制自某大牛):

 

假设存在一个序列d[1..9] = 2 1 5 3 6 4 8 9 7,可以看出来它的LIS长度为5。
下面一步一步试着找出它。


我们定义一个序列B,然后令 i = 1 to 9 逐个考察这个序列。
此外,我们用一个变量Len来记录现在最长算到多少了

 

首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1

 

然后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1

 

接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2

 

再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,因为1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,于是可以把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2

 

继续,d[5] = 6,它在3后面,因为B[2] = 3, 而6在3后面,于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6,还是很容易理解吧? Len = 3 了噢。

 

第6个, d[6] = 4,你看它在3和6之间,于是我们就可以把6替换掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3

 

第7个, d[7] = 8,它很大,比4大,嗯。于是B[4] = 8。Len变成4了

 

第8个, d[8] = 9,得到B[5] = 9,嗯。Len继续增大,到5了。

 

最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,所以我们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。

 

于是我们知道了LIS的长度为5。

 

注意。这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,但是如果后面再出现两个数字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的长度为6。

 

模板:

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>
#define MAXN 40005
using namespace std;
int arr[MAXN],ans[MAXN],len;
int main()
{
    int n;
    int T;
    cin>>T;
    while(T--)
    {
        cin>>n;
        for(int i=1; i<=n; ++i)
            scanf("%d",&arr[i]);
        ans[1] = arr[1];
        len=1;
        for(int i=2; i<=n; ++i)
        {
            if(arr[i]>ans[len])
                ans[++len]=arr[i];
            else
            {
                int pos=lower_bound(ans,ans+len,arr[i])-ans;
                ans[pos] = arr[i];
            }
        }
        cout<<len<<endl;
    }
    return 0;
}

 顺便附上手写的二分

int binary_search(int i)
{
    int left,right,mid;
    left=0,right=len;
    while(left<right)
    {
        mid = left+(right-left)/2;
        if(ans[mid]>=arr[i]) right=mid;
        else left=mid+1;
    }
    return left;
}


//int pos=binary_search(i)  这样调用就好了

 三、最长公共子序列

引进一个二维数组c[][],用c[i][j]记录X[i]与Y[j] 的LCS 的长度,b[i][j]记录c[i][j]是通过哪一个子问题的值求得的,以决定搜索的方向。
我们是自底向上进行递推计算,那么在计算c[i,j]之前,c[i-1][j-1],c[i-1][j]与c[i][j-1]均已计算出来。此时我们根据X[i] = Y[j]还是X[i] != Y[j],就可以计算出c[i][j]。

状态转移方程如下:

首先做初始化。将c[0][i]和从c[i][0]初始化为0,然后一行一行的填表。

代码:

#include<cstring>
#include<cmath>
#include<cstring>
#include<cstdio>
const int qq=1e3+10;
char x[qq],y[qq];
int dp[qq][qq];
int main()
{
    while(~scanf("%s%s",x+1,y+1))
    {
        x[0]=y[0]='.';
        int len=strlen(x)>strlen(y)?strlen(x):strlen(y);
        for(int i=0; i<=len; ++i)
            dp[i][0]=dp[0][i]=0;
        for(int j,i=1; i<strlen(x); ++i)
            for(j=1; j<strlen(y); ++j)
                if(x[i]==y[j])
                    dp[i][j]=dp[i-1][j-1]+1;
                else
                    dp[i][j]=dp[i-1][j]>dp[i][j-1]?dp[i-1][j]:dp[i][j-1];
        printf("%d
",dp[strlen(x)-1][strlen(y)-1]);
    }
    return 0;
}

  

三、最长公共子串

明白了最长公共子序列后,最长上升字串特别简单,状态转移方程如下:

代码如下:

#include<cstring>
#include<cmath>
#include<cstring>
#include<cstdio>
const int qq=1e3+10;
char x[qq],y[qq];
int dp[qq][qq];
int main()
{
    while(~scanf("%s%s",x+1,y+1))
    {
        int max_len=0;
        for(int i=0; i<strlen(x); i++)
        {
            for(int j=0; j<strlen(y); j++)
            {
                if(x[i]==y[j])
                {
                    if(i>0&&j>0)
                    {
                        dp[i][j]=dp[i-1][j-1]+1;
                    }
                    else
                    {
                        dp[i][j]=1;
                    }
                    if(max_len<dp[i][j])
                    {
                        max_len=dp[i][j];
                    }
                }
            }
        }
        printf("%d
",max_len);
    }
    return 0;
}
原文地址:https://www.cnblogs.com/aiguona/p/7278141.html