【CSP 201803-3】URL映射

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qian2213762498/article/details/82714737

201803-3  URL映射

问题描述

  URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。

  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。

输入格式

  输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。

输出格式

  输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。

样例输入

5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js

样例输出

year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js

样例说明

  对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
  对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
  对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
  对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。

数据规模和约定

  1 ≤ n ≤ 100,1 ≤ m ≤ 100。
  所有输入行的长度不超过 100 个字符(不包含换行符)。
  保证输入的规则都是合法的

AC Code (100分代码)

调试调了好久,后来发现for(int j=0;j<n;j++)里面j<n写成了i<n;

按照题意理解,考虑三种匹配的情况即可。


#include <iostream>
#include <cstdio>
#include <vector>
using namespace std;
const int nmax=105;
string rule[nmax];//规则 
string name[nmax];//规则名 
int L[nmax]; //记录每条规则的长度 
string str;//待匹配的URL地址串
string R;  //R记录带匹配规则串中<...>中间的内容 
string S;  //S记录带匹配地址串中<...>中间的内容
vector<string> ans;
 
int main(int argc, char** argv) {
	int n,m;//规则数、带匹配地址数 
	int len;//带匹配URL地址的长度 
	int rule_pos;
	int str_pos;
	bool error;//匹配失败的标志 
	bool flag; //全部匹配均失败的标志 
	cin>>n>>m;
	for(int i=0;i<n;i++){
		cin>>rule[i]>>name[i];
		L[i]=rule[i].length(); 
	}
	for(int i=0;i<m;i++){//匹配m个待处理的URL地址 
		flag=false;
		cin>>str;
		len=str.length();
		for(int j=0;j<n;j++){
			//cout << "Here is rule NO." << j << endl;
			str_pos=0;
			rule_pos=0;
			error=false; 
			ans.clear();
			//同时匹配URL地址 与 规则 
			while(str_pos<len && rule_pos<L[j]){
				//cout << "At str_pos = " << str_pos << " , rule_pos = " << rule_pos << endl;
				//匹配 <...>中的3种情况 
				if(rule[j][rule_pos]=='<'){
					//cout<<"if Testing"<<endl;
					rule_pos++;
					R.clear();
					while(rule[j][rule_pos]!='>'){
						R+=rule[j][rule_pos];
						rule_pos++;
					}rule_pos++; //把>读入
					
 					//R有3种情况,分别进行匹配判断 
					if(R=="int"){
						//cout<<"int Testing"<<endl;
						S.clear();
						while(true){
							//三个while(true)的出口
							//判断是否读到'/'? 是否长度达到len? 是否出现非法字符? 
							if(str_pos==len){//while的处口 
								if(S.length()==0){//S中没有出现0~9的合法数字 
									error=true;
								}
								break; 
							}
							if(str[str_pos]=='/'){
								if(S.length()==0){
									error=true;
								}
								break;
							} 
							else if(str[str_pos]>='0'&&str[str_pos]<='9'){
								S+=str[str_pos];
								str_pos++;
							} 
							else{
								error=true;
								break;
							}
						}
						if(error)
							break;
						//因为 
						if(S.find_first_not_of('0')==string::npos)
							ans.push_back("0");
						else{
							S=S.substr(S.find_first_not_of('0'));
							ans.push_back(S);
						} 
					} 
					else if(R=="str"){
						//cout<<"str"<<endl;
						S.clear();
						while(true){
							//三个while(true)的出口
							//判断是否读到'/'? 是否长度达到len? 是否出现非法字符?
							if(str_pos==len){
								if(S.length()==0){
									error=true;
								} 
								break;
							} 	
							if(str[str_pos]=='/'){	
								if(S.length()==0){
									error=true;
								}
								break;
							} 
							else if(str[str_pos]>='0'&&str[str_pos]<='9'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]>='a'&&str[str_pos]<='z'){
								S+=str[str_pos];
								str_pos++;
							}
							else if(str[str_pos]>='A'&&str[str_pos]<='Z'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]=='_'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]=='-'){
								S+=str[str_pos];
								str_pos++;
							}
							else if(str[str_pos]=='.'){
								S+=str[str_pos];
								str_pos++;
							}
							else{
								error=true;
								break;
							}
						}
						if(error)
							break;
						ans.push_back(S);
					}
					else{//R=="path"
						//cout<<"path Testing"<<endl;
						S.clear();
						while(true){
							//三个while(true)的出口
							//判断是否读到'/'? 是否长度达到len? 是否出现非法字符?
							if(str_pos==len){
								if(S.length()==0){
									error=true;
								}
								break; 
							}
							if(str[str_pos]=='/'){//path中可以读入/ 
								S+=str[str_pos];
								str_pos++;
							} 
							else if(str[str_pos]>='0'&&str[str_pos]<='9'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]>='a'&&str[str_pos]<='z'){
								S+=str[str_pos];
								str_pos++;
							}
							else if(str[str_pos]>='A'&&str[str_pos]<='Z'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]=='_'){
								S+=str[str_pos];
								str_pos++; 
							}
							else if(str[str_pos]=='-'){
								S+=str[str_pos];
								str_pos++;
							}
							else if(str[str_pos]=='.'){
								S+=str[str_pos];
								str_pos++;
							}
							else{
								error=true;
								break;
							}
						}
						if(error)
							break;
						ans.push_back(S);
					}
				}//
				//没有出现<....> 
				else{
					//cout<<"else Testing"<<endl;
					if(rule[j][rule_pos]!=str[str_pos]){
						error=true;
						break;
					} 
					str_pos++;
					rule_pos++;
				} 
			}//如果有一个超过长度了
			if(str_pos<len || rule_pos<L[j]){
				error=true;
			}
			//cout<<"error:"<<error<<endl;
			if(!error){
				//cout<<"进入!error"<<endl; 
				cout<<name[j];
				for(int m=0;m<ans.size();m++) cout<<" "<<ans[m];
				cout<<endl;
				flag=true;
				break;
			}
		}//for 0....n 
		if(!flag) cout<<"404"<<endl;
	}//for 0....m 
	return 0;
}


猜你喜欢

转载自blog.csdn.net/qian2213762498/article/details/82714737