按照${xxx 固定字符串 xxx}$ 提取数据.
采取的提取方式 (contractNo){1} 固定为一个
然后左边和右边都有一个无{和无}的字符串
String desStr = "${sdsfddfs${0=房源序号, 1=序号,contractNo, 2=合同编号, 3=项目名称}$ ${aacontractNoa}$sddssdd}$";
String regex = "\\$\\{[^(\\{\\})]*(contractNo){1}[^(\\{\\})]*\\}\\$"; //这个[^(\\{\\})] 排除不是很好理解修改成[^(\\{\\})]
String regex = "\\$\\{[^(\\{\\})]*(contractNo){1}[^(\\{\\})]*\\}\\$";
String regex = "\\{{1}[^\\{\\}]*?\\}{1}"; //提取{字符串} 格式的字符串
Pattern mPattern = Pattern.compile(regex);
Matcher mMatcher = mPattern.matcher(desStr);
//System.out.println("\n");
int j=0;
while (mMatcher.find()) {
j++;
System.out.println("====ok==="+j);
System.out.println(mMatcher.group());
}
------------正则表达式贪婪与非贪婪模式
----------
之前做程序的时候看到过正则表达式的贪婪与非贪婪模式,今天用的时候就想不起来了,现在这里总结一下,以备自己以后用到注意。
1.什么是正则表达式的贪婪与非贪婪匹配
如:String str="abcaxc";
Patter p="ab*c";
贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。
非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。
2.编程中如何区分两种模式
默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。
量词:{m,n}:m到n个
*:任意多个
+:一个到多个
?:0或一个
3.程序实例
使用Snort的规则一条规则的一部分作为匹配文本,匹配出其中的content部分。
1 import java.util.regex.Matcher; 2 import java.util.regex.Pattern; 3 4 public class RegularTest { 5 6 public static void main(String[] arg){ 7 String text="(content:\"rcpt to root\";pcre:\"word\";)"; 8 String rule1="content:\".+\""; //贪婪模式 9 String rule2="content:\".+?\""; //非贪婪模式 10 11 System.out.println("文本:"+text); 12 System.out.println("贪婪模式:"+rule1); 13 Pattern p1 =Pattern.compile(rule1); 14 Matcher m1 = p1.matcher(text); 15 while(m1.find()){ 16 System.out.println("匹配结果:"+m1.group(0)); 17 } 18 19 System.out.println("非贪婪模式:"+rule2); 20 Pattern p2 =Pattern.compile(rule2); 21 Matcher m2 = p2.matcher(text); 22 while(m2.find()){ 23 System.out.println("匹配结果:"+m2.group(0)); 24 } 25 } 26 }