提取指定模式的字符串

按照${xxx 固定字符串 xxx}$ 提取数据.

采取的提取方式 (contractNo){1} 固定为一个

然后左边和右边都有一个无{和无}的字符串

String desStr = "${sdsfddfs${0=房源序号, 1=序号,contractNo, 2=合同编号, 3=项目名称}$ ${aacontractNoa}$sddssdd}$";

String regex = "\\$\\{[^(\\{\\})]*(contractNo){1}[^(\\{\\})]*\\}\\$"; //这个[^(\\{\\})] 排除不是很好理解修改成[^(\\{\\})]

String regex = "\\$\\{[^(\\{\\})]*(contractNo){1}[^(\\{\\})]*\\}\\$";

String regex = "\\{{1}[^\\{\\}]*?\\}{1}"; //提取{字符串} 格式的字符串

Pattern mPattern = Pattern.compile(regex);

Matcher mMatcher = mPattern.matcher(desStr);

//System.out.println("\n");

int j=0;

while (mMatcher.find()) {

j++;

System.out.println("====ok==="+j);

System.out.println(mMatcher.group());

}

------------正则表达式贪婪与非贪婪模式

----------

之前做程序的时候看到过正则表达式的贪婪与非贪婪模式，今天用的时候就想不起来了，现在这里总结一下，以备自己以后用到注意。

1.什么是正则表达式的贪婪与非贪婪匹配

　　如：String str="abcaxc";

　　　　Patter p="ab*c";

　　贪婪匹配:正则表达式一般趋向于最大长度匹配，也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str，结果就是匹配到：abcaxc(ab*c)。

　　非贪婪匹配：就是匹配到结果就好，就少的匹配字符。如上面使用模式p匹配字符串str，结果就是匹配到：abc(ab*c)。

2.编程中如何区分两种模式

　　默认是贪婪模式；在量词后面直接加上一个问号？就是非贪婪模式。

　　量词：{m,n}：m到n个

　　　　　*：任意多个

　　　　　+：一个到多个

　　　　　？：0或一个

3.程序实例

使用Snort的规则一条规则的一部分作为匹配文本，匹配出其中的content部分。

 1 import java.util.regex.Matcher;
 2 import java.util.regex.Pattern;
 3 
 4 public class RegularTest {
 5     
 6     public static void main(String[] arg){
 7         String text="(content:\"rcpt to root\";pcre:\"word\";)";
 8         String rule1="content:\".+\"";    //贪婪模式
 9         String rule2="content:\".+?\"";    //非贪婪模式
10         
11         System.out.println("文本："+text);
12         System.out.println("贪婪模式："+rule1);
13         Pattern p1 =Pattern.compile(rule1);
14         Matcher m1 = p1.matcher(text);
15         while(m1.find()){
16             System.out.println("匹配结果："+m1.group(0));
17         }
18         
19         System.out.println("非贪婪模式："+rule2);
20         Pattern p2 =Pattern.compile(rule2);
21         Matcher m2 = p2.matcher(text);
22         while(m2.find()){
23             System.out.println("匹配结果："+m2.group(0));
24         }
25     }
26 }

提取指定模式的字符串

猜你喜欢