表达式解析引擎的设计

技术2022-07-01 167

前言

表达式的计算是一个一般性的问题。在报表领域，经常会出现支持计算公式的需求。MS Office Excel中的函数计算就是一个很好的参考例子。

本文提供一个表达式引擎的设计方案，能够满足报表领域的复杂计算要求。

一个良好的表达式引擎应该支持基本的二元运算和函数调用，而且二元运算能够嵌套函数调用，函数调用也能够嵌套二元运算，比如：

例子1：=2>1&&((Num(1)+2*Num((Num(2)+2)*3/Num(2)))/2>0||2>1)&&0>1，执行结果：0

例子2：=Switch(Num(1),是, Num(0),否)，执行结果：是

例子3：=Switch(20<10,1 ,20>=10, 20 + 20*0.1)，执行结果：22

当然，实际的应用里，表达式中要支持变量的绑定，比如：

例子1(计算税后金额)：=Fields!数量.Value * Fields!单价.Value*(1 + Fields!税率.Value / 100)

例子2(不同价格不同税后金额)：=Fields!数量.Value*Fields!单价.Value*Switch(Fields!单价.Value<100, 1.1, Fields!单价.Value<500, 1.08, Fields!单价.Value<800, 1.07)

至于常用的一元运算，能够通过函数调用就很方便的实现，例如：取非，Not(exp1)。

表达式的定义

要支持二元运算能够嵌套函数调用，函数调用也能够嵌套二元运算，需要采用解析器设计模式，定义数个表达式对象，用表达式对象树来描述表达式字符串。

值表达式：用来描述一个常量或变量，例如：1.1，Fields!数量.Value，Parameters!经手人.Value，字符串

二元表达式：用来描述一个二元运算，例如：exp1 + exp2，exp1

函数表达式：用来描述一个函数调用，例如：Num(exp1)，Sum(exp1)， Switch(cond1, proc1, cond2, proc2…)

运算符优先级

运算符优先级很重要，决定了运算的顺序，特别是括号，能够改变表达式的运算顺序。

优先级

运算符

说明

-1

(

左括号

-1

)

右括号

-2

幂运算

-3

乘

-3

除

-3

取余

-4

加

-4

减

-5

小于

-5

小于等于

-5

大于

-5

大于等于

-6

等于

-6

不等于

-7

逻辑与

-8

逻辑或

表达式引擎的工作流程

二元运算解析生成后缀表达式数组的过程

中缀表达式解析成后缀表达式的方法如下，要借用一个临时堆栈stack，输出是后缀表达式数组output：

（1）从右向左依次读取表达式字符串str。

（2）如果str是操作数(常量或变量)，输出到output。

（3）如果str是运算符（含左右括号），则做以下判断：

a）如果str = '('，放入堆栈stack。

b）如果str = ')'，依次弹出堆栈stack中的运算符输出到output，直到遇到'('为止。

c）如果str不是')'或者'('，那么就和堆栈stack顶点位置的运算符top做优先级比较。

1）如果top是'('或者str优先级比top高，那么将str放入堆栈stack。

2）如果str优先级低于或者等于top，那么输出top到output，然后将str放入堆栈stack。

（4）如果表达式字符串已经读取完成，而堆栈stack中还有运算符时，依次由顶端输出到output。

后缀表达式数组生成表达式对象树的过程

计算后缀表达式的方法如下，要借用一个临时堆栈stack：

（1）从左向右扫描后缀表达式数组，依次取出一个数组元素data。

（2）如果data是表达式，就压入堆栈stack。

（3）如果data是运算符，就从堆栈stack中弹出此运算符需要用到的表达式的个数(二元运算符需要2个)，创建一个新二元表达式，然后把二元表达式压入堆栈stack。

（4）如果数组处理完毕，堆栈stack中最后剩余的表达式就是最终结果。

例如，表达式=(Num(1)+2*Num(Num(2)+2*3/Num(2)))/2，生成的后缀表达式数组如下：

0: Method{num, [Const(1)]}

1: Const(2)

2: Method{num, [Binary{+, Method{num, [Const(2)]}, Binary{/, Binary{*, Const(2), Const(3)}, Method{num, [Const(2)]}}}]}

3: *

4: +

5: Const(2)

6: /

该后缀表达式数组生成的表达式对象树如下：

Binary{/, Binary{+, Method{num, [Const(1)]}, Binary{*, Const(2), Method{num, [Binary{+, Method{num, [Const(2)]}, Binary{/, Binary{*, Const(2), Const(3)}, Method{num, [Const(2)]}}}]}}}, Const(2)}

剩下的工作就是执行表达式对象树，输出结果。

专利

最新回复(0)