Distinct Subsequences(不同子序列的个数)——b字符串在a字符串中出现的次数、动态规划

Given a string S and a string T, count the number of distinct subsequences ofT inS.

A subsequence of a string is a new string which is formed from the original string by deleting some (can be none) of the characters without disturbing the relative positions of the remaining characters. (ie,"ACE" is a subsequence of"ABCDE" while "AEC" is not).

Here is an example:
S = "rabbbit"T = "rabbit"

Return 3.

简单翻译一下,给定两个字符串S和T,求S有多少个不同的子串与T相同。S的子串定义为在S中任意去掉0个或者多个字符形成的串。

递归求解:

首先找到在S中与T的第一个字符相同的字符,从这个字符开始,递归地求S和T剩下的串。T为空串时,返回1。因为空串本身是另外一个串的一个子序列。这个算法实现简单,但是果然不出意料,大集合超时。

Java代码:

 1 public int numDistinct(String S, String T) {  
 2   // Start typing your Java solution below  
 3   // DO NOT write main() function  
 4   if (S.length() == 0) {  
 5     return T.length() == 0 ? 1 : 0;  
 6   }  
 7   if (T.length() == 0) {  
 8     return 1;  
 9   }  
10   int cnt = 0;  
11   for (int i = 0; i < S.length(); i++) {  
12     if (S.charAt(i) == T.charAt(0)) {  
13       cnt += numDistinct(S.substring(i + 1), T.substring(1));  
14     }  
15   }  
16   return cnt;  
17 }  

遇到这种两个串的问题,很容易想到DP。但是这道题的递推关系不明显。可以先尝试做一个二维的表int[][] dp,用来记录匹配子序列的个数(以S ="rabbbit",T = "rabbit"为例):

    r a b b b i t

  1 1 1 1 1 1 1 1

0 1 1 1 1 1 1 1

a 0 1 1 1 1 1 1

b 0 0 2 3 3 3

b 0 0 0 0 3 3 3

i 0 0 0 0 0 0 3 3

t 0 0 0 0 0 0 0 3  

从这个表可以看出,无论T的字符与S的字符是否匹配,dp[i][j] = dp[i][j - 1].就是说,假设S已经匹配了j - 1个字符,得到匹配个数为dp[i][j - 1](即若S[j]!=T[i],则该出现次数等于T[0-i]在S[0-(j-1)]出现的次数).现在无论S[j]是不是和T[i]匹配,匹配的个数至少是dp[i][j - 1]。除此之外,当S[j]和T[i]相等时,我们可以让S[j]和T[i]匹配,然后让S[j - 1]和T[i - 1]去匹配(T[0-(i-1)]在S[0-(j-1)]出现的次数*(T[i]==S[j])=1)
所以递推关系为:

dp[0][0] = 1; // T和S都是空串.

dp[0][1 ... S.length() - 1] = 1; // T是空串,S只有一种子序列匹配。

dp[1 ... T.length() - 1][0] = 0; // S是空串,T不是空串,S没有子序列匹配。

dp[i][j] = dp[i][j - 1] + (T[i - 1] == S[j - 1] ? dp[i - 1][j - 1] : 0).1 <= i <= T.length(), 1 <= j <= S.length()

 1 class Solution {
 2 public:
 3     int numDistinct(string S, string T) {
 4         if(S.empty()||T.empty()) return 0;
 5         if(S.length()<T.length()) return 0;
 6         int dp[T.length()+1][S.length()+1];
 7         dp[0][0]=1;
 8         for(int i=1;i<=T.length();i++){
 9             dp[i][0]=0;
10         }
11         for(int j=1;j<=S.length();j++){
12             dp[0][j]=1;
13         }
14         for(int i=1;i<=T.length();i++){
15             for(int j=1;j<=S.length();j++){
16                 dp[i][j]=dp[i][j-1];
17                 if(T[i-1]==S[j-1])
18                     dp[i][j]+=dp[i-1][j-1];
19             }
20         }
21         return dp[T.length()][S.length()];
22     }
23 };
原文地址:https://www.cnblogs.com/zl1991/p/7004492.html