【wikioi】1040 统计单词个数

算法：划分型DP

PS：被卡过3天。日期：2013-10-10 ~ 2013-10-12 18:52:48

这题是我提交了13次AC= =汗= =

题目描述：

给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入，且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40)，且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后，其第一个字母不能再用。例如字符串this中可包含this和is，选用this之后就不能包含th)（管理员注：这里的不能再用指的是位置，不是字母本身。比如thisis可以算做包含2个is）。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。

注意：

1、此题和【wikioi】1017 乘积最大的性质差不多，都是划分k份（1017是添乘号，其实就是分k+1份）

2、唯一不同的是，判断单词是一个整体，少一个就不能加入，所以要特别注意

3、此题预处理恶心，就是在主DP前还要DP一个二维数组a，a[i][j]表示下标i->j单词数（恶心就恶心在更新这里，我是看了别人的题解的= =）

首先是主方程DP：

我们用F[n][k]来表示0到n（因为是字符串，我用string存的）划分成k份得到的数最大

得到：

F[i][1] = a[1][i] (0 <= i < str.size())

F[i][k] = max(F[i][k], A[j+1][i]*F[j][k-1]) (k-1 <= j < i, 2 <= k <= m) //m是要分成的份数

//想想为什么是k-1而不是k？因为是分成k份，相当于有k-1个乘号

for(int l = 2; l <= k; l++)
	for(int i = l-1; i < str.size(); i++)
		for(int j = i-1; j >= l-1; j--)
			f[i][l] = max(f[i][l], f[j][l-1] + a[j+1][i]);

然后到初始化a数组的DP：

我们从字符串屁股找起（j=str.size()-1 -> 0），每一次设i从j到0更新a[i][j]

很容易得到方程

a[i][j] = a[i+1][j] + 1 (以i为下标找到一个单词（必须以i为单词的第一个下标）)

a[i][j] = a[i+1][j] (以i为下标找不到单词，就等于i+1->j的单词数)

//dic是存单词的，str是整个字符串
int yes, i, j, l;
for(j = str.size()-1; j >= 0; j--)
	for(i = j; i >= 0; i--)
	{
		for(l = 0; l < s; l++)
		{
			yes = 0;
			//其实就是看str[j]到i后面是否加了新单词，加了就直接退出（即使有相同的串，更何况不相同的了）
			if(str.find(dic[l], i) == i && dic[l].size() <= j-i+1) yes = 1; //如果以i开头找到新单词
			/* //也可以这样
			if(str[i] == dic[l][0] && dic[l].size() <= j-i+1)
			{
				yes = 1;
				for(int p = 0; p < dic[l].size(); p++)
					if(str[i+p] != dic[l][p])
					{
						yes = 0; break;
					}
			}
			*/
			if(yes) break;
		}
		if(yes) a[i][j] = a[i+1][j]+1;
		else    a[i][j] = a[i+1][j];
	}

总结：

1、贪心策略用错：

错：判断是否有前缀，有前缀就跳过。（贪心，因为有了前缀的话，应该用短的，将长的去掉）

正解：不需要此贪心，在dp中已包含

2、一直认为是某个点错，没考虑是整体错误

3、被数据坑得以为对，一直提交

以后多多注意= =

放上全部代码：

#include <iostream>
#include <string>
#include <cstring>
using namespace std;

string str, dic[6];
bool cdic[6][6], used[6];
int a[210][210], f[210][40], k, s;

void chu() //初始化a数组，a[i][j]表示下标i->j单词数
{
	memset(a, 0, sizeof(a));
	int yes, i, j, l;
	for(j = str.size()-1; j >= 0; j--)
		for(i = j; i >= 0; i--)
		{
			for(l = 0; l < s; l++)
			{
				yes = 0;
				//其实就是看str[j]到i后面是否加了新单词，加了就直接退出（即使有相同的串，更何况不相同的了）
				if(str.find(dic[l], i) == i && dic[l].size() <= j-i+1) yes = 1; //如果以i开头找到新单词
				/* //也可以这样
				if(str[i] == dic[l][0] && dic[l].size() <= j-i+1)
				{
					yes = 1;
					for(int p = 0; p < dic[l].size(); p++)
						if(str[i+p] != dic[l][p])
						{
							yes = 0; break;
						}
				}
				*/
				if(yes) break;
			}
			if(yes) a[i][j] = a[i+1][j]+1;
			else    a[i][j] = a[i+1][j];
		}
}

void dp()
{
	memset(f, 0, sizeof(f));
	for(int i = 0; i < str.size(); i++)
		f[i][1] = a[0][i];
	for(int l = 2; l <= k; l++)
		for(int i = l-1; i < str.size(); i++)
			for(int j = i-1; j >= l-1; j--)
				f[i][l] = max(f[i][l], f[j][l-1] + a[j+1][i]);
}

void print()
{
	cout << f[str.size()-1][k] << endl;
}

void init()
{
	string temp;
	int n, p;
	cin >> n;
	while(n--)
	{
		cin >> p >> k;
		str = "";
		while(p--)
		{
			cin >> temp; str += temp;
		}
		cin >> s;
		for(int i = 0; i < s; i++)
			cin >> dic[i];
		chu();
		dp();
		print();

	}
}

int main()
{
	init();
	return 0;
}