Length of the longest substring without repeating characters

给出一个字符串，找出这个字符串中最长连续的而且没有重复字符的子串，并返回它的长度。例如，对于字符串“BDEFGABEF”最长连续且没有重复字符的子串可以是“DEFGAB”或者“DEFGAB”，长度是6。对于字符串“BBBB”，它满足要求的字串的长度是1，即“B”。

首先分析一下，对于给定长度的字符串，它一共有多少个字串呢？子串数 = 长度为1的子串数+长度为2的子串数+ 。。。+长度为n的子串数 = （n + 1） * n / 2
。对于每个子串，在O（n）的时间内遍历它，看它是否有重复的字符出现。计算（n + 1） * n / 2个子串共需要花费的时间是O（n^3）。对于长度很长的字符串，这样的计算时间显然不行，下面介绍一种O（n）时间就可以搞定的算法。这个算法首先增加辅助空间，visited[256]，其中visited[i]表示ascii为i的字符出现的索引位置。因为索引都是从0开始的，所有把visited的所有值都初始化为0，接下来具体算法：

1，维护变量max_len表示满足要求的最大值，cur_len表示当前计算的没有重复字符的子串的长度，pre_index表示当前索引处的字符在之前出现过的位置，-1表示没有出现过。

2，对于每个当前遍历的字符，我们检查它在之前已经处理过的部分，也就是当前字符之前的所有字符中是否包含当前字符，如果没有出现过，那么我们就将cur_len++,以增加当前最长连续而且没有重复字符的子串的长度。

3，如果当前字符（即i索引处）的字符在之前出现过，出现的索引值是pre_index，那么要做判断，判断pre_index处的字符是否在当前最长连续且没有重复字符串中，如果不在那么就将cur_len++，如果在的话那么就要首先判断max_len 与cur_len之间的关系，然后根据他们的关系来决定是否改变max_len，之后还得处理cur_len的值，因为已经出现了重复字符了，这样cur_len就得改变，改变成当前索引出的字符到pre_index处下一个字符位置差值，这样做，当前满足条件的子串才不会有重复的字符。

下面对上面的算法举个例子，GEEKSFORGEEKS：

1，

这个时候因为之前没有G，所以cur_len++，记录G出现位置。

2，

3，

之前E出现过，而且之前cur_len=2，所以得减去之前E出现的索引，用max_len记录遍历过的最大长度，之前max_len是0.

4，

5，

6，

7，

8，

9，

10，

剩下的大家有兴趣自己画图吧，下面给出代码：

#include<iostream>
#include<string>
using namespace std;

const int CH_NUM = 256;

int longest_non_repeat_str(const char* s) {
	int i;
	int pre_index = -1;
	int length = strlen(s);
	int max_len = 0;
	int cur_len = 1;
	int visited[CH_NUM] = {-1};
	visited[s[0]] = 0; // first char has been visited
	for (i = 1; i < length; i++) {
		pre_index = visited[s[i]];
		if (-1 == pre_index || i - cur_len > pre_index) {
			cur_len++;
		} else {
			if (cur_len > max_len)
				max_len = cur_len;
			cur_len = i - pre_index;
		}
		visited[s[i]] = i;
	}
	if (cur_len > max_len)
		max_len = cur_len;
	return max_len;
}

int main(int argc, char* argv[]) {
	char s[] = "geeksforgeeks";
	int rst = longest_non_repeat_str(s);
	cout << rst << endl;
	cin.get();
	return 0;
}