正在阅读：函数式组合子逻辑Java parser框架(一)函数式组合子逻辑Java parser框架(一)

2004-12-02 16:42 出处：CSDN 作者：ajoo 责任编辑：linjixiong

　　一、释名

　　为什么叫精神？
　　如果你熟悉c++，那么你可能知道一个叫做”spirit”的parser库。它利用c++的模板元编程能力，使用c++语言本身提供了一个递归下降文法解析的框架。

　　我这里介绍的jparsec库，就是一个java里面的递归下降文法解析框架。
　　不过，它并非是spirit的java版本。

　　Jparsec的蓝本来自Haskell语言的parsec库。Parsec是一个基于monad的parser组合子库。

　　这个库的目的是要在java中提供一个类似parsec, spirit的库，这种组合子库并非c++的专利，java/c#也可以做到。这个库还将在java5.0上被改写，类型安全上它将也不再逊色于c++。

　　那么，为什么叫“函数式”呢？java是面向对象的嘛。
　　如果你使用过haskell, lisp等语言，这个函数式不用解释你也知道是怎么回事了。
　　如果你是一个老牌的c++/java程序员，那么这里还要稍微解释一下。当然如果您对这些虚头八脑的名词不感兴趣，那么，你尽可以跳过这一章，不知道什么是“函数式”，并不会影响你对这个库的理解的。

　　C++这几年随着gp的普及，“函数式”这个老孔乙己逐渐又被人从角落里面拽了出来。一个c++程序员所熟悉的“函数式”很可能是stl的for_each, transform，count_if这些函数。
　　怎么说呢，就象我不能否定str.length()这个调用属于OO一样，我也无法说for_each, transform不是函数式。

　　但是，“函数式”的精髓不在于此。

　　一般归纳起来，就像我们说OO是什么多态，封装，继承一样，“函数式”的特征被总结为：

　　1.无副作用。
　　2.高阶函数。
　　3.延迟计算

　　而最最有意义的（至少我认为如此），是基于高阶函数的函数组合能力。一些人把这叫做glue。
　　简短地说，什么让函数式编程如此强大？是用简单的函数组合出复杂函数的能力。

　　我可以想象，说到这里，你还是一头雾水。“什么是组合？1+1不是也把两个1组合成2了吗？new A(new B(), new C())不也是从B和C组合成A了？”

　　为了直观，我们来举个例子吧。
　　假设，我们在package predicates内部有一个接口：

　　interface SPredicate{ 　　boolean is(String s); 　　}

　　我们有几个基本的实现：

　　class IsEmpty implements Spredicate{ 　　public boolean is(String s){return s.length()==0;} 　　}

　　这个实现判断字符串是不是空。

　　class IsCaptialized implements Spredicate{…}

　　这个实现判断这个字符串是不是大写打头。

　　class IsLowercase implements Spredicate{…}

　　这个实现判断字符串是不是全小写。

　　class IsEqual implements Spredicate{ 　　Private final String v; 　　Public Boolean is(String s){return s.equals(v);} 　　IsEqual(String v){this.v = v;} 　　}

察看评论详细内容我要发表评论

作者笔名	简短内容	发表时间
:

2回顶部

　　这个实现判断这个字符串是否和制定的字符串相等。

　　类似的基本实现还可以有很多。

　　下面，假如我们希望实现一个Spredicate，它要判断“这个字符串是个小写字符串，或者等于hello”。
　　我们怎么办呢？

　　我们当然可以这样：

　　class Predicate1 implements Spredicate{ 　　Boolean is(String v){ 　　Return v.isLowercase() || v.equals(“hello”); 　　} 　　}

　　只不过，这样一来，我们没有重用IsEqual和IsLowercase这两个类的代码，虽然逻辑上我们是和这两个类有重叠。

　　我们当然也可以直接调用IsEqual和IsLowercase的代码，如：

　　class Predicate1 implements Spredicate{ 　　Boolean is(String v){ 　　return new IsEqual().is(v) || new IsLowercase().is(v); 　　} 　　}

　　只不过，这样的代码是过程式的，非常死板。
　　如果我再有一个IsEqual或者IsCapitalized的逻辑呢？还要再写一个Predicate2类么？
　　如果你OO有一定功底，一定可以看出，这个代码不符合IOC原则，在不该new的地方new了。

　　好，知错就改，根据IOC原则，我们重构如下：

　　class OrPredicate implements Spredicate{ 　　private final Spredicate p1; 　　private final Spredicate p2; 　　public Boolean is(String s){ 　　return p1.is(s) || p2.is(s); 　　} 　　}

　　构造函数我就不写了。

　　如此，Predicate1我们就可以写成new OrPredicate(new IsLowercase(), new IsEqual(“hello”));

　　类似的，我们可以加上AndPredicate, NotPredicate, XorPredicate.
　　这样，基本上就可以覆盖所有的布尔操作了。

　　我们在写我们自己的Predicate的时候，就根本不必写is函数，甚至可以忘记is函数的存在。我们面对的不再是一个有着一个boolean is(String)签名的接口，而是一个可以通过各种规则组合的类型。

　　一个Predicate可以简单如new NotPredicate(p)，也可以复杂如：

　　new AndPredicate(new OrPredicate(a,new XorPredicate(b,c), d));

　　擦擦眼睛，现在，我们等于自己制造出一个可以用一些特定规则组合的类型，而Spredicate的签名甚至都不再重要了。我们的客户程序从操作字符串变成了操作各种Spredicate对象，这已经是更高一级的抽象了。

　　为了表现这一点，让我们把Spredicate改成abstract class, 并把is()函数改成包私有（这样我们外面的用户程序就再也看不到这个函数了）。

察看评论详细内容我要发表评论

作者笔名	简短内容	发表时间
:

3回顶部

　　等等！你可能发现了，现在我们虽然可以自由组合不同的Spredicate对象，但是组合之后有什么用呢？is函数看不见了，难道我们就是为了组合而组合吗？
　　不错，一个完整的组合子，还缺最后一小块。

　　让我们在predicates包内部再加上一个utility函数：

　　public Boolean runPredicate(Spredicate p, String s){ 　　Return p.is(s); 　　}

　　好了，功德圆满，我们可以用这个runPredicate函数来执行一个组合好了的Spredicate对象，而不用关心这个对象内部的is函数。

　　你可能有点怀疑。RunPredicate(p, s)和p.is(s)有什么区别？

　　呵呵，现在是没什么区别。下面我们来看看什么时候这种封装有明显的好处。
　　假设根据实现需要我们的Spredicate.is函数不是现在看到的这么简单，它可能是：
　　Boolean is(String s, PredicateContext ctxt);
　　PredicateContext对象负责存储并传递一些包局部的信息。
　　此时，我们很有可能不希望把这个签名对外公布。因为这个签名非常有可能变化，它是一个包的实现细节。PredicateContext甚至都是个包私有的类型。

　　此时，把is函数隐藏起来就是必要的了。对外，我们只公开一个runPredicate工具函数：

　　public Boolean runPredicate(String s, Spredicate p){ 　　final PredicateContext ctxt = new PredicateContext(); 　　return p.is(s, ctxt); 　　}

　　好，现在客户程序可以随意组合各个Predicate对象，最后用runPredicate函数运行。而包内部在演化时，完全可以根据需要随时改动is函数的签名，增加新的状态。

　　这，就是一个完整的组合子的例子。

察看评论详细内容我要发表评论