正在阅读:函数式组合子逻辑Java parser框架(一)函数式组合子逻辑Java parser框架(一)

2004-12-02 16:42 出处:CSDN 作者:ajoo 责任编辑:linjixiong

  一、释名

  为什么叫精神?
  如果你熟悉c++,那么你可能知道一个叫做”spirit”的parser库。它利用c++的模板元编程能力,使用c++语言本身提供了一个递归下降文法解析的框架。

  我这里介绍的jparsec库,就是一个java里面的递归下降文法解析框架。
  不过,它并非是spirit的java版本。

  Jparsec的蓝本来自Haskell语言的parsec库。Parsec是一个基于monad的parser组合子库。

  这个库的目的是要在java中提供一个类似parsec, spirit的库,这种组合子库并非c++的专利,java/c#也可以做到。这个库还将在java5.0上被改写,类型安全上它将也不再逊色于c++。

  那么,为什么叫“函数式”呢?java是面向对象的嘛。
  如果你使用过haskell, lisp等语言,这个函数式不用解释你也知道是怎么回事了。
  如果你是一个老牌的c++/java程序员,那么这里还要稍微解释一下。当然如果您对这些虚头八脑的名词不感兴趣,那么,你尽可以跳过这一章,不知道什么是“函数式”,并不会影响你对这个库的理解的。

  C++这几年随着gp的普及,“函数式”这个老孔乙己逐渐又被人从角落里面拽了出来。一个c++程序员所熟悉的“函数式”很可能是stl的for_each, transform,count_if这些函数。
  怎么说呢,就象我不能否定str.length()这个调用属于OO一样,我也无法说for_each, transform不是函数式。

  但是,“函数式”的精髓不在于此。

  一般归纳起来,就像我们说OO是什么多态,封装,继承一样,“函数式”的特征被总结为:

  1.无副作用。
  2.高阶函数。
  3.延迟计算

  而最最有意义的(至少我认为如此),是基于高阶函数的函数组合能力。一些人把这叫做glue。
  简短地说,什么让函数式编程如此强大?是用简单的函数组合出复杂函数的能力。

  我可以想象,说到这里,你还是一头雾水。“什么是组合?1+1不是也把两个1组合成2了吗?new A(new B(), new C())不也是从B和C组合成A了?”

  为了直观,我们来举个例子吧。
  假设,我们在package predicates内部有一个接口:


  interface SPredicate{
  boolean is(String s);
  }



  我们有几个基本的实现:


  class IsEmpty implements Spredicate{
  public boolean is(String s){return s.length()==0;}
  }


  这个实现判断字符串是不是空。


  class IsCaptialized implements Spredicate{…}


  这个实现判断这个字符串是不是大写打头。


  class IsLowercase implements Spredicate{…}


  这个实现判断字符串是不是全小写。


  class IsEqual implements Spredicate{
  Private final String v;
  Public Boolean is(String s){return s.equals(v);}
  IsEqual(String v){this.v = v;}
  }




察看评论详细内容 我要发表评论
作者笔名简短内容 发表时间
:



  这个实现判断这个字符串是否和制定的字符串相等。

  类似的基本实现还可以有很多。

  下面,假如我们希望实现一个Spredicate,它要判断“这个字符串是个小写字符串,或者等于hello”。
  我们怎么办呢?

  我们当然可以这样:


  class Predicate1 implements Spredicate{
  Boolean is(String v){
  Return v.isLowercase() || v.equals(“hello”);
  }
  }

  只不过,这样一来,我们没有重用IsEqual和IsLowercase这两个类的代码,虽然逻辑上我们是和这两个类有重叠。

  我们当然也可以直接调用IsEqual和IsLowercase的代码,如:

  class Predicate1 implements Spredicate{
  Boolean is(String v){
  return new IsEqual().is(v) || new IsLowercase().is(v);
  }
  }


  只不过,这样的代码是过程式的,非常死板。
  如果我再有一个IsEqual或者IsCapitalized的逻辑呢?还要再写一个Predicate2类么?
  如果你OO有一定功底,一定可以看出,这个代码不符合IOC原则,在不该new的地方new了。

  好,知错就改,根据IOC原则,我们重构如下:


  class OrPredicate implements Spredicate{
  private final Spredicate p1;
  private final Spredicate p2;
  public Boolean is(String s){
  return p1.is(s) || p2.is(s);
  }
  }

  构造函数我就不写了。

  如此,Predicate1我们就可以写成new OrPredicate(new IsLowercase(), new IsEqual(“hello”));

  类似的,我们可以加上AndPredicate, NotPredicate, XorPredicate.
  这样,基本上就可以覆盖所有的布尔操作了。

  我们在写我们自己的Predicate的时候,就根本不必写is函数,甚至可以忘记is函数的存在。我们面对的不再是一个有着一个boolean is(String)签名的接口,而是一个可以通过各种规则组合的类型。

  一个Predicate可以简单如new NotPredicate(p),也可以复杂如:

  new AndPredicate(new OrPredicate(a,new XorPredicate(b,c), d));

  擦擦眼睛,现在,我们等于自己制造出一个可以用一些特定规则组合的类型,而Spredicate的签名甚至都不再重要了。我们的客户程序从操作字符串变成了操作各种Spredicate对象,这已经是更高一级的抽象了。

  为了表现这一点,让我们把Spredicate改成abstract class, 并把is()函数改成包私有(这样我们外面的用户程序就再也看不到这个函数了)。




察看评论详细内容 我要发表评论
作者笔名简短内容 发表时间
:


  等等!你可能发现了,现在我们虽然可以自由组合不同的Spredicate对象,但是组合之后有什么用呢?is函数看不见了,难道我们就是为了组合而组合吗?
  不错,一个完整的组合子,还缺最后一小块。

  让我们在predicates包内部再加上一个utility函数:

  public Boolean runPredicate(Spredicate p, String s){
  Return p.is(s);
  }


  好了,功德圆满,我们可以用这个runPredicate函数来执行一个组合好了的Spredicate对象,而不用关心这个对象内部的is函数。

  你可能有点怀疑。RunPredicate(p, s)和p.is(s)有什么区别?

  呵呵,现在是没什么区别。下面我们来看看什么时候这种封装有明显的好处。
  假设根据实现需要我们的Spredicate.is函数不是现在看到的这么简单,它可能是:
  Boolean is(String s, PredicateContext ctxt);
  PredicateContext对象负责存储并传递一些包局部的信息。
  此时,我们很有可能不希望把这个签名对外公布。因为这个签名非常有可能变化,它是一个包的实现细节。PredicateContext甚至都是个包私有的类型。

  此时,把is函数隐藏起来就是必要的了。对外,我们只公开一个runPredicate工具函数:


  public Boolean runPredicate(String s, Spredicate p){
  final PredicateContext ctxt = new PredicateContext();
  return p.is(s, ctxt);
  }


  好,现在客户程序可以随意组合各个Predicate对象,最后用runPredicate函数运行。而包内部在演化时,完全可以根据需要随时改动is函数的签名,增加新的状态。

  这,就是一个完整的组合子的例子。



察看评论详细内容 我要发表评论
作者笔名简短内容 发表时间
:

关注我们

最新资讯离线随时看 聊天吐槽赢奖品