(程序员面试题)字符串处理之寻找最大不重复子串

#include <stdio.h>
#include <string.h>
#define MAXLINE 4096

int is_str_has_same_char(const char *str)
{
	int temp[256];
	int pos = 0;
	for (int tmp = 0; tmp < 256; temp[tmp] = 0, tmp++);
	for (; *str != ''; temp[*str]++, str++);
	for (; (temp[pos] < 2) && (pos < 256); pos ++);
	if (pos < 256)
		return 1;
	return 0;
}

int get_max_no_same_sub_str(const char *str, char *result)
{
	int len = strlen(str);
	int num = 0;
	char temp[MAXLINE];
	for (; num < len; num++) {
		for (int pos = 0; pos <= num; pos++) {
			strncpy(temp, str + pos, len - num);
			if (is_str_has_same_char(temp) == 0) {
				strcpy(result, temp);
				return 0;
			}
			memset(temp, 0x00, MAXLINE);
		}
	}
	return -1;
}

int main(int argc, char *argv[])
{
	char result[MAXLINE];
	int ret = 0;
	if ((ret = get_max_no_same_sub_str(argv[1], result)) == 0) {
		printf("result = %s
", result);
		return 0;
	}
	printf("not found
");
	return -1;
}


测试结果如下:

cheny@cheny-laptop:~$ ./get_max_no_same_sub_str abcabcdd
result = abcd
cheny@cheny-laptop:~$ ./get_max_no_same_sub_str aaaaa
result = a

这个问题可以分为两个小问题来解决:

(1)字符串分割,即分割出字符串的所有子串,长度由大到小的分割。

(2)确认分割出来的子串中判断是否有重复的字符,这个建立了一个256长度的数组,下标表示字符的值,值表示字符的数目,这个算法在字符统计里面算一个比较巧妙的实现,一旦没有重复的字符则立即终止运算,因为子串是由长到短的分割,所以当前子串即为最长不重复子串。

写的不好请大家指正,谢谢了!


附注:pace君说这题可以参考KMP算法,先mark一下,好歹是有更高端的实现了,站在巨人的肩膀上,性能应该有所提升的。


原文地址:https://www.cnblogs.com/riasky/p/3429138.html