2-字符串模拟- URL映射

问题描述

试题编号: 201803-3
试题名称: URL映射
时间限制: 1.0s
内存限制: 256.0MB
问题描述:
问题描述
  URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。
输入格式
  输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。
输出格式
  输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。
样例输入
5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js
样例输出
year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js
样例说明
  对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
  对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
  对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
  对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。
数据规模和约定
  1 ≤ n ≤ 100,1 ≤ m ≤ 100。
  所有输入行的长度不超过 100 个字符(不包含换行符)。
  保证输入的规则都是合法的。

思路:就是字符串模拟匹配,细节很多,而且题目要求不是很明确,第一发60分,改了两个点100分过了; 我采用的是通过 / 去分割字符字符串,返回vector,但是注意最后的 / 有的要单独判断!

代码后面给出了此题我踩过的坑点!!!

#include <iostream>
#include <cstring>
#include <cstdio>
#include <vector>
using namespace std;
string str[105];
string str_2[105];
string s;
int n, m;
vector<string> a[105];

vector<string> split(const string &str,const string &pattern){
	//本函数功能:将字符串str按pattern分割,返回string容器 
    //const char* convert to char*
    //标准库的string类提供了3个成员函数来从一个string得到c类型的字符数组:c_str()、data()、copy(p,n)
    //c_str():生成一个const char*指针,指向以空字符终止的数组 
    char * strc = new char[strlen(str.c_str())+1];
    strcpy(strc, str.c_str());
    vector<string> resultVec;
    char* tmpStr = strtok(strc, pattern.c_str());
    while (tmpStr != NULL)
    {
        resultVec.push_back(string(tmpStr));
        tmpStr = strtok(NULL, pattern.c_str());
    }
    delete[] strc;
    
    return resultVec;
}

int isLegal(string x){
	int len = x.length();
	for(int i = 0; i < len; i++){
		if(x[i] == '.' || x[i] == '-' || x[i] == '_' || 
		(x[i] >= '0' && x[i] <= '9') || (x[i] >= 'a' && x[i] <= 'z') || 
		(x[i] >= 'A' && x[i] <= 'Z') || x[i] == '/')
			continue; 
		else{
			return 0;
		}
	}
	return 1;
}

string pipei(string s1){
    vector<string> s = split(s1, "/");
	int len1 = s.size();
	int flag = 1, isp = 0;
	for(int i = 0; i < n; i++){
		flag = 1;
		isp = 0;
		int len2 = a[i].size();
		string rt;
		if(len1 < len2){
			continue;
		}
		int j;
		for(j = 0; j < len1 && j < len2 && flag; j++){
//			cout << "j: " << j << "; rt: " << rt << endl;
			if(a[i][j] == s[j]){
				continue;
			}
//			cout << "-----" << a[i][j] << endl;
			if(a[i][j] == "<int>"){
				long long zs = 0;
				string temp;
				for(int k = 0; k < s[j].length(); k++){
					if(s[j][k] >= '0' && s[j][k] <= '9'){
						if(k == 0){
							if(s[j][k] == '0')
								continue;
						}
						temp += s[j][k];  //组合数字 
					}
					else{
						flag = 0;
						break;
					}
				}
				if(flag == 1)
					rt = rt + " " + temp;  //将其放入输出字符串 
				else{
					break;
				}
			}
			else if(a[i][j] == "<str>"){
				
				rt = rt + " " + s[j];  //将其放入输出字符串 
			}
			else if(a[i][j] == "<path>"){
				
				rt += " ";
				rt += s[j];
				j++;
				while(j < len1){
					rt = rt + "/" + s[j];
					j++;
				}
				
				int L = s1.length(); //检查path是否一定是规则结束 
				if(s1[L-1] == '/'){  //这个点20分!!! 
					rt += "/";
				}
				isp = 1;
				break;
			}
			else{
				flag = 0;
				break;
			}
		}
		if(flag == 1 && (j >= len1 && j >= len2)){
//			cout << "|||||||||||||| " << str_2[i] << endl;
			int L1 = str[i].length() - 1, L2 = s1.length() - 1;
//			cout  << "y---------------y" <<endl;
			if(isp == 0 && !(str[i][L1] ==  s1[L2] || (str[i][L1] != '/' && s1[L2] != '/'))){
				//这里是保证最后/是否一致,处path外,要么都有,要么都没 
				continue;     //这个点20分!!! 
			} 
			return str_2[i] + rt;
		}
	}
	return "404";
}

int main(){

  给出几组我踩过的坑点:

1 1
/abc/<int> test
/abc/0
输出:
test
//这里一个零时就啥都不输出???

1 1
/abc/<int>/ test
/abc/0
输出:
404

1 1
/abc/<path> yyy
/abc/123/
输出:
yyy 123/

1 1 
/<str>/ yy 
/okokok
输出:404

  

原文地址:https://www.cnblogs.com/zhumengdexiaobai/p/9550804.html