antlr入门教程1

huanzhugege 2006-05-24 02:35:07
一、 Antlr 的主要类:

Antlr 中有主要类有两种(其实还有一种 TreeLexer )

Lexer: 文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段:)并不对其作任何修改。

Parser: 解析器类。主要用于处理经过 Lexer 处理后的各段。一些具体的操作都在这里。


二、 Antlr 文法文件形式:
Antlr 文件是 *.g 形式,即以 g 为后缀名。

例如: t.g

class P extends Parser;









startRule









: n:NAME









{System.out.println("Hi there, "+n.getText());}









;









class L extends Lexer;









// one-or-more letters followed by a newline









NAME: ( 'a'..'z'|'A'..'Z' )+ NEWLINE









;









NEWLINE









: '\r' '\n' // DOS









| '\n' // UNIX









;


具体成分分析:









1 、总体结构









Class P extends Parser









Class L extends Lexer









两行同 JAVA 继承一样, P 继承 Parser 类; L 继承 Lexer 类。每个 .g 文件只能各有一个。









2 、 Lexer 类分析









一般按照









类型名:
匹配的具体规则










的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名 NEWLINE 出现在 NEW 的匹配规则中。









3 、 Parser 类分析









一般按照









起始规则名:









规则实例名:类型名或规则名









{Java 语句。。。; }



















。。。。。。。。。









的形式构成。









起始规则名:任意。









规则实例名:就象 Java 中“ String s ;”的 s 一样。规则实例名用于在之后的 JAVA 语句中调用。









类型名或规则名:可以是在 Lexer 中定义的类型名,也可以是 Parser 中定义的规则名。感觉就像是 int 与 Integer 的区别。









Java 语句:指当满足当前规则时所执行的语句。 Antlr 会自动嵌入生成的 java 类中。
























三、生成 Java 类









1 、从 www.antlr.org 上下载 antlr-x.x.x.jar









2 、配置环境变量: classpath=.;x:\jdk\lib\tools.jar;x:\antlr-x.x.x.jar









3 、在 t.g 所在目录下执行:









java antlr.Tool t.g









会在当前目录下生成如下文件:









L.java : Lexer 文法分析器 java 类。









P.java : Parser 解析器 java 类。









PTokenTypes.java : Lexer 中定义的类型具体化,供 Parser 解析器调用。









PTokenTypes.txt :当外部的(如 t2.g )要调用当前的类型或规则时要用到本文件。





















四、执行









1 、编写 Main 类
import java.io.*;
class Main {
public static void main(String[] args) {

try {



L lexer = new L(new DataInputStream(System.in));
P parser = new P(lexer); parser.startRule();
} catch(Exception e)
{
System.err.println("exception: "+e);
}


}
}

2 、执行
c:\> javac *.java
c:\> java Main
Terence
^Z
Hi there, Terence
c:\>

本文作者kingchou是CowNew开源团队SQL解析引擎项目组负责人。
更多内容请见CowNew开源团队网站 www.cownew.com
论坛 http://www.cownew.com/newpeng/

...全文
182 1 打赏 收藏 举报
写回复
1 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
qinqinxiatiao 2006-05-24
class P extends Parser;
startRule
: n:NAME
{System.out.println("Hi there, "+n.getText());}
;
class L extends Lexer;
// one-or-more letters followed by a newline
NAME: ( 'a'..'z'|'A'..'Z' )+ NEWLINE
;
NEWLINE
: '\r' '\n' // DOS
| '\n' // UNIX
;
具体成分分析:

1 、总体结构
Class P extends Parser
Class L extends Lexer
两行同 JAVA 继承一样, P 继承 Parser 类; L 继承 Lexer 类。每个 .g 文件只能各有一个。
2 、 Lexer 类分析
一般按照
类型名:
匹配的具体规则

的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名 NEWLINE 出现在 NEW 的匹配规则中。
3 、 Parser 类分析
一般按照
起始规则名:
规则实例名:类型名或规则名

{Java 语句。。。; }



。。。。。。。。。
的形式构成。

起始规则名:任意。

规则实例名:就象 Java 中“ String s ;”的 s 一样。规则实例名用于在之后的 JAVA 语句中调用。

类型名或规则名:可以是在 Lexer 中定义的类型名,也可以是 Parser 中定义的规则名。感觉就像是 int 与 Integer 的区别。
Java 语句:指当满足当前规则时所执行的语句。 Antlr 会自动嵌入生成的 java 类中。

三、生成 Java 类

1 、从 www.antlr.org 上下载 antlr-x.x.x.jar

2 、配置环境变量: classpath=.;x:\jdk\lib\tools.jar;x:\antlr-x.x.x.jar

3 、在 t.g 所在目录下执行:

java antlr.Tool t.g

会在当前目录下生成如下文件:
L.java : Lexer 文法分析器 java 类。
P.java : Parser 解析器 java 类。
PTokenTypes.java : Lexer 中定义的类型具体化,供 Parser 解析器调用。
PTokenTypes.txt :当外部的(如 t2.g )要调用当前的类型或规则时要用到本文件。
四、执行

1 、编写 Main 类
import java.io.*;
class Main {
public static void main(String[] args) {

try {

L lexer = new L(new DataInputStream(System.in));
P parser = new P(lexer); parser.startRule();
} catch(Exception e)
{
System.err.println("exception: "+e);
}


}
}
  • 打赏
  • 举报
回复
相关推荐
发帖
Java EE
加入

6.7w+

社区成员

J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
申请成为版主
帖子事件
创建了帖子
2006-05-24 02:35
社区公告
暂无公告