解析器模式(Interpreter Pattern)。

定义

解释器模式是一种按照规定语法进行解析的方案,在现在项目中使用较少,其定义如下:

给定一门语言,定义他的文法的一种表示,并定义一个解释器,该解释器使用该表示来解释语言中的句子。

  • Expression——抽象解释器

具体的解释任务由各个实现类完成,具体的解释器分别由TerminalExpression和NonterminalExpression完成。

  • TerminalExpression——终结符表达式

实现与文法中的元素相关联的解释操作,通常一个解释器模式中只有一个终结符表达式,担忧多个实例,对应不同的终结符。

  • NonterminalExpression——非终结符表达式

文法中每条规则对应于一个非终结表达式。非终结符表达式根据逻辑的复杂程度而增加,原则上每个文法规则都对应一个非终结符表达式。

  • Context——环境角色

例如采用HashMap。

通用源码

解释器是一个比较少用的模式,以下为其通用源码,可以作为参考。抽象表达式通常只有一个方法,如下所示。

public abstract class Expression {
	/**
	 * 每个表达式必须有一个解析任务
	 * 
	 * @param ctx
	 * @return
	 */
	public abstract Object interpreter(Context ctx);
}

抽象表达式是生成语法集合(也叫做语法树)的关键,每个语法集合完成指定语法解析任务,他是通过递归调用的方式,最终由最小的语法单元进行解析完成。终结符表达式如下所示。

public class TerminalExpression extends Expression {

	@Override
	public Object interpreter(Context ctx) {
		// 通常终结符表达式只有一个,但是有多个对象
		return null;
	}

}

通常,终结符表达式比较简单,主要是处理场景元素和数据的转换。

非终结符表达式如下所示。

public class NonterminalExpression extends Expression {
    /**
     * 每个非终结符表达式都会对其他表达式产生依赖
     *
     * @param expressions
     */
    public NonterminalExpression(Expression... expressions) {
    }

    @Override
    public Object interpreter(Context ctx) {
        // 进行文法处理
        return null;
    }

}

每个非终结符表达式都代表了一个文法规则,并且每个文法规则都只关心自己周边的文法规则的结果(注意是结果),因此这就产生了每个非终结符表达式调用自己周边的非终结符表达式,然后最终、最小的文法规则就是终结符表达式,终结符表达式的概念就是如此,不能够再参与比自己更小的文法运算了。

客户类如下所示。

public class Client {
	public static void main(String[] args) {
		Context ctx =new Context();
		// 通常定一个语法容器,容纳一个具体的表达式,通常为ListArray、LinkedList、Stack等类型
		Stack<Expression> stack = new Stack<Expression>();
		/*
		 * 进行语法判断,并产生递归调用
		 */
		// 产生一个完整的语法树,由各个具体的语法分析进行解析
		Expression exp = stack.pop();
		// 具体元素进入场景
		exp.interpreter(ctx);
	}
}

通常Client是一个封装类,封装的结果就是传递进来一个规范语法文件,解析器分析后产生结果并返回,避免了调用者与语法解析器的耦合关系。

优点

解释器是一个简单语法分析工具,他最显著的优点就是扩展性,修改语法规则只要修改相应的非终结符表达式就可以了,若扩展语法,则只要增加非终结符类就可以了。

缺点

  • 解析器模式会引起类膨胀

每个语法都要产生一个非终结符表达式,语法规则比较复杂时,就可能产生大量的类文件,为维护带来了非常多的麻烦。

  • 解释器模式采用递归调用方法

每个非终结符表达式只关心与自己有关的表达式,每个表达式需要知道最终的结果,必须一层一层的剥茧,无论是面向过程的语言还是面向对象的语言,递归都是在必要条件下使用的,他导致调试非常复杂。想想看,如果要排查一个语法错误,我们是不是要一个断点一个断点的调试下去,直到最小的语法单元。

  • 效率问题

解释器模式由于使用了大量的循环和递归,效率是一个不容忽视的问题,特别是一用于解析复杂、冗长的语法时,效率是难以忍受的。

使用场景

  • 重复发生的问题可以使用解释器模式

例如,多个引用服务器,每天产生大量的日志,需要对日志文件进行分析处理,由于各个服务器的日志格式不同,但是数据要素是相同的,按照解释器的说法就是终结符表达式都是相同的,但是非终结符表达式就需要制定了。在这种情况下,可以通过程序来一劳永逸的解决该问题。

  • 一个简单语法需要解释的场景

为什么是简单?看看非终结符表达式,文法规则越多,复杂度越过,而且类间还要进行递归调用。想想看,多个类之间的调用你需要什么样的耐心和信息去排查问题。因此,解释器模式一般用来解析比较标准的字符集,例如SQL语法分析,不过该部分逐渐被专用工具所取代。

在某些特用的商业环境下才会采用解释器模式,而且现在模型运算的例子非常多,目前很多商业机构已经能够提供出大量的数据进行分析。

注意事项

尽量不要在重要的模块中使用解释器模式,否则维护会是一个很大的问题。在项目中可以使用shell、JRuby、Groovy等脚本语言来代替解释器模式,弥补Java编译型语言的不足。我们子啊一个银行的分析型项目中就采用JRuby进行运算处理,避免使用解释器模式的四则运算,效率和性能各方面表现良好。

最佳实践

解释器模式在实际的系统开发中使用得非常少,因为他会引起效率、性能以及维护等问题,一般在大中型的框架型项目能够找到他的身影,如一些数据分析工具,报表设计工具、科学计算工具等,若你确定遇到“一种特定类型的额问题发生的频率足够高”的情况,准备使用解释器模式时,可以考虑一下Expression4J、MESP(Math Expression String Parser)、Jep等开源的解析工具包,功能都异常强大,而且非常容易使用,效率也还不错,实现大多数的数学运算完全没有问题,自己没有必要从头开始编写解释器。有人已经建立了一条康庄大道,何必再走自己的泥泞小路呢?

猜你喜欢

转载自blog.csdn.net/en_joker/article/details/82799061