从Lex&Yacc说到编译器(二、flex的使用)
2011年11月19日
二、flex的使用
看了第一篇的关于正则表达式的说明后,下面我们就来通过它,使用flex这个词法分析工具来构造我们的编译器的词法分析器.
关于lex的教程应该是很多,这里我就简单地介绍一下,然后着重后面的lex和yacc的配合使用以及其技巧.所以,如果你不看了后还是不太明白lex或者yacc的使用,请你自己上网去查查,这方面的教程是很多的.我知道的一篇常见的就是
Yacc 与 Lex 快速入门
Lex 与 Yacc 介绍
它的作者就是Ashish Bansal.
Flex就是fast lex的意思.而lex就是Lexical Analyzar的意思.flex可以在cygwin或者gnupro中找到.它是unix的一个工具,属于GNU组织产品.网上也可以找到单独可以在windows下用的版本.
我们一般把我们的词法扫描程序要扫描的一些单词(token)用正则表达式写好,然后作为lex的输入文件,输入命令flex xxx.l(xxx.l就是输入文件),lex经过处理后,就能得到一个名字叫lex.yy.c的C源代码.这个C源代码文件,就是我们的词法扫描程序.通常lex为我们生成的词法分析器的C源代码都是十分复杂而且庞大的,我们一般根本不会去查看里面的代码(放心好了,flex这个东西不会出错的)
下面让我们看看几个我已经使用过的几个lex输入文件.
这是一个前段时间我为GBA上的一个RPG游戏写的脚本引擎所使用的lex输入文件(部分)
例2.1
%{
#include
#include
#include
#include "globals.h"
%}
digit [0-9]
number ("-"|"+")?{digit}+
hexnumber "0x"({digit}|[a-fA-F])+
letter [a-zA-Z]
identifier ({letter}|_)({number}|{letter}|_)*
newline [\n]
whitespace [ \t]+
string \"[^"]*\"
comment "#"[^#]*"#"
%%
{string} { return VM_STRING; }
"Logo" { return VMIN_LOGO; }
"FaceIn" { return VMIN_FACEIN; }
"FaceOut" { return VMIN_FACEOUT; }
"LoadTile" { return VMIN_LOAD_TILE; }
"CreateRole" { return VMIN_CREATE_ROLE; }
"ReleaseRole" { return VMIN_RELEASE_ROLE;}
"CreateMap" { return VMIN_CREATE_MAP; }
"ReleaseMAP" { return VMIN_RELEASE_MAP;}
"ShowBitmap" { return VMIN_SHOWBITMAP; }
"CreateDialog" { return VMIN_CREATE_DIALOG; }
"ReleaseDialog" { return VMIN_RELEASE_DIALOG;}
"Fight" { return VMIN_FIGHT; }
"Delay" { return VMIN_DELAY; }
"PressA" { return VMIN_PRESS_A; }
"PressB" { return VMIN_PRESS_B; }
"PressR" { return VMIN_PRESS_R; }
"PressL" { return VMIN_PRESS_L; }
"PressStart" { return VMIN_PRESS_START; }
"PressSelect" { return VMIN_PRESS_SELECT;}
{number} { return VM_NUMBER; }
{whitespace} { }
{identifier} { return VM_ID; }
{newline} ;
. ;
%%
int yywrap()
{ return 1; } 这里的lex输入文件一共有三个部分,用%%分开.第一部分中的%{和}%中的内容就是直接放在lex输出C代码中的顶部.我们通过它可以来定义一些所需要的宏,函数和include一些头文件等等.我的这个lex输入文件中也没什么特别的东西,就是常规的C源文件的include头文件
%{
#include
#include
#include
#include "globals.h"
%}
第一部分中,除了前面的%{和}%包含的部分,下面的就是正则表达式的定义.
看了第一篇的正则表达式,这样你就能够在这里派上用场了.
让我们来看看我这里定义的正则表达式:
digit [0-9]
number ("-"|"+")?{digit}+
hexnumber "0x"({digit}|[a-fA-F])+
letter [a-zA-Z]
identifier ({letter}|_)({number}|{letter}|_)*
newline [\n]
whitespace [ \t]+
string \"[^"]*\"
comment "#"[^#]*"#"
digit就不用说了,就是0-9的阿拉伯数字定义,第一篇文章中也举了这个例子.number就是digit的1到无限次的重复,再在其前面加上”+”和”-“符号.
注意:
“a”: 即使a是元字符,它仍是字符a
\a: 当a是元字符时候,为字符a
a?: 一个可选的a,也就是说可以是a,也可以没有a
a|b: a或b
(a): a本身
[abc]: 字符a,b或c中的任一个
[a-d]: a,b,d或者d中的任一个
[^ab]: 除了a或b外的任何一个字符
.: 除了新行之外的任一个字符
{xxx}: 名字xxx表示的正则表达式
这里需要特别说明的就是
newline [\n]
newline就是新行,这里我使用了[]把\n换行号括起来.因为如果我直接用\n表示的话,那么按照上面的规则,那就会看成\和n两个字符,所以我使用了[\n].有些时候newline也被写成[\n]|[\r\n].因为在文本文件中,一般换行一次,那么就是一个\n(0xA),可是在二进制文件中,换行有时候又是\r\n(0xD,0xA)一共两个字符号.
第二部分就是定义扫描到正则表达式的动作.
这些动作其实就是C代码,它们将会被镶嵌在lex输出的C文件中的yylex()函数中.
上面的例子的动作其实十分平常,就是返回一个值.
我们在外部使用这个lex为我们生成C代码的时候,只需要使用它的int yylex()函数.当我们使用一次yylex(),那么就会自动去扫描一个匹配的正则表达式,然后完成它相应的动作.这里的动作都是返回一值,那么yylex就会返回这个值.通常默认yylex返回0时候,表示文件扫描结束,所以你的动作中最好不要返回0,以免发生冲突.当然,动作中也可以不返回一值,那么yylex就会完成这个动作后自动扫描下一个可以被匹配的字符串,一直到扫描到文件结束.
当扫描到一个可以被匹配的字符串,那么这个时候,全局变量yytext就等于这个字符串
请大家一定记住这些正则表达式的顺序.
如果出现一个字符串,可以同时匹配多个正则表达式,那么它将会被定义在前面的正则表达式匹配.所以我一般把字符串string定义在最前面.
如果文件中的字符没有被lex输入文件中任何一个字符匹配,那么它会自动地被标准输出.所以大家一定要记住在每个正则表达式处理完毕后,一定要加上{newline}和.这两个正则表达式的动作.
好,让我们看看lex为我们输出C文件中提供一些常量
Lex 变量 yyin FILE* 类型。 它指向 lexer 正在解析的当前文件。 yyout FILE* 类型。 它指向记录 lexer 输出的位置。 缺省情况下,yyin 和 yyout 都指向标准输入和输出。 yytext 匹配模式的文本存储在这一变量中(char*)。 yyleng 给出匹配模式的长度。 yylineno 提供当前的行数信息。(lexer不一定支持。) 例2.2 这是>书中配套的源代码的lex输入文件.大家可以参考一下,作者为它自己定义的一个Tiny C编译所做的词法扫描器.
%{
#include "globals.h"
#include "util.h"
#include "scan.h"
char tokenString[MAXTOKENLEN+1];
%}
digit [0-9]
number {digit}+
letter [a-zA-Z]
identifier {letter}+
newline \n
whitespace [ \t]+
%%
"if" {return IF;}
"then" {return THEN;}
"else" {return ELSE;}
"end" {return END;}
"repeat" {return REPEAT;}
"until" {return UNTIL;}
"read" {return READ;}
"write" {return WRITE;}
":=" {return ASSIGN;}
"=" {return EQ;}
"flex输入文件的.再次说明,如果你是第一次接触lex,那么请看看前面我推荐的文章,你可以在IBM的开发者网上查到.下一篇关于yacc于BNF文法的说明也是如此.请大家先参考一下其它标准的教程.
发表评论
-
C#字符串替换_无视大小写
2012-07-06 09:52 793源代码翻译工具基本完成了,只剩下最后问题:就是对字符串进行 ... -
java正则表达式验证整数、浮点数和日期
2012-07-06 09:46 1145/** * 检查日期格式 * @param date * ... -
mailto语法
2012-07-06 09:30 640i am now in university(HIT@We ... -
PowerShell2.0之与COM对象交互(四)IE自动化
2012-07-05 20:45 662上一篇文章主要介绍了powershell中通过COM操作E ... -
(二)启动组件:intent
2012-07-03 13:44 657当有一个来自于content resolver的请求指向C ... -
flex list/tilelist drag scroll的speed移动太快
2012-07-02 12:47 679最近项目中遇到tilelist中拖拽的时scroll的移动 ... -
flex4:中DataGroup组件获取数据源(ArrayCollection方式)实例
2012-07-02 12:47 532flex/spark" xmlns:mx=&q ... -
[ActionScript3.0][My flex]读书笔记三之 模块化编程
2012-07-02 12:47 5321.加载mxml模块 第一步: 新建mxml模块:Data ... -
Flex 4 控件居中问题
2012-07-02 12:46 646今天尝试了一下,flex4开发,做了个panel,设置Ap ... -
Flex+Java 导出PDF文件(大小不定)时进度条应用
2012-07-02 12:46 6191.当点击"导出到PDF"按钮时,会弹 ... -
Flex ColumnChart verticalAxis 中的title在变换皮肤时的异常
2012-07-01 10:11 794在ColumnChart 中添加了title的显示,但在更 ... -
Flex数据绑定陷阱(二)
2012-07-01 10:11 538尝试绑定一个没有包含IPropertyChangeNoti ... -
在Flex Mobile中构建“本地”菜单
2012-07-01 10:11 689Adobe Flash Builder 4 简体中文正式版 ... -
给你的Flex程序添加深链接和分析-其实比你想象的要简单
2012-07-01 10:11 716Adobe Flash Builder 4 简 ... -
Flex 数据易犯错误: 常见误用和错误
2012-07-01 10:11 500在某些情形下,绑定操作似乎不能正常工作,此时你可能非常懊恼 ... -
记忆游戏(flex3版)
2012-06-30 16:35 614记忆游戏(flex3版) 2010年12月12日 接触f ... -
flash develop vs flex builder
2012-06-30 16:35 456flash develop vs flex builder ... -
[转]使用Flash、HTML和Unity开发网页游戏的现实比较
2012-06-30 16:35 1086[转]使用Flash、HTML和Unity ... -
【FLEX学习】第二天
2012-06-30 16:35 311【FLEX学习】第二天 2011年02月14日 米写日志 ...
相关推荐
从lex&yacc说到编译器(二)flex的使用
2.lexyacc-simple.tgz,一个简单的simple语言的编译器,可以解释执行,也可编译为栈机器的汇编语言。 3.cc-ansi99-parser_20130313_082654.tgz,一个ansi99标准的C语言的编译器,只进行词法和语法分析,不生成目标...
用lex 和yacc做的一个简单的带有词法分析 语法分析 语义分析的一个编译器,供大家参考
本项目是基于flex,bison和LLVM,使用c ++ 11实现的类C语法编译器,使用flexbindingyacc对源代码进行词法,语法分析;在语法分析阶段生成整个源代码相应的抽象语法树后,根据LLVM IR(中间表示)模块中定义的中间...
GNU/Linux 下面的Lex 是flex, 而Yacc 则是bison。另外需要的就是一个C/C++ 语言编译器,由于我们采用的是GNU 的 lex 和yacc,所以,理所当然的我们就 使用GNU 的编译器了,如果是Unix 或者Linux 系统 ,那么编译器...
lexyacc-计算器这个解释器包括 2 个文件来运行一个 flex 文件和一个 yacc 文件。 打开终端并转到这些文件所在的文件夹编写命令 lex bc.l 来编译 lex 文件然后写yacc term1.y编译yacc文件,这会生成y.tab.c 然后用c...
lex和yacc编写的c语言编译器 词法分析与语法分析的原始文件扩展: ://www.quut.com/c/ANSI-C-grammar-l-1998.html和 实现了C语言除了struct和指针几乎所有的语法。 运行 环境要求:flex bison g ++ 11 python3 中间...
flex&bison 英文PDF 及随书代码,编译器设计的工具, 可以提高编译器设计的效率。 文件包内还包含了lex&yacc的中文翻译版及其lex与yacc的程序开发者写的手册。
我的lex和yacc程序的存储库。 怎么跑? 设置如下:0。sudo apt-get更新0。sudo apt-get install flex0。sudo apt-get install bison0。sudo apt-get git-core 获取此仓库:0。git clone 编译:0. lex filename....
Lex Flex Yacc野牛Lex,Flex,Yacc和Bison的语法突出显示。 此扩展基于以下扩展:概述编程语言的编译器或解释器通常分解为两部分: 阅读源程序并发现其结构。 处理此结构,例如生成目标程序。 Lex和Yacc可以生成解决...
描述词法分析器的文件*.l,经过lex编译后,生成一个lex.yy.c 的文件,然后由C编译器编译生成一个词法分析器。词法分析器,简单来说,其任务就是将输入的各种符号,转化成相应的标识符(token),转化后的标识符 很容易...
LEX是UNIX的工具,因此我们需要使用FLEX代替,使得在windows下使用。提供lex,flex ,在win下也能体验编译的快乐
《flex与bison》被期待已久,是经典O’Reilly系列书籍《lex & yacc》的续篇。在原书出版以来的近20年中,flex和bison已被证明比原来的Unix工具更可靠、更强大。 《flex与bison》一书涵盖了Linux和Unix程序开发中相同...
compiler 在windows下可以使用的lex&yacc编译器,使用超级方便 LEX是词法分析器,主要作用类似于扫描器,输入为源代码(当然我们现在写的示例不一定是源代码),输出为词法单元(泛化的东西,比如1,2,3都可以被称为...
要生成编译器可执行文件,可以直接使用 flex 和 bison(以及一些 C 编译器)。 然而,推荐的方法是使用 waf(见下文)。 生成词典: lex lexer.l 转换 yacc 文件: yacc -d parser.y 或者 bison --define=y....
编译器使用的分析程序,也就是lex。配合yacc(bison)一起使用。
An SQL parser, generated from Bison (Yacc) and Flex (Lex). Original version - most of the work - comes from John Levine's Flex & Bison book published by O'Reilley. Example usage: $ echo "SELECT a.name...
同时还包含了一个MinGW的GNU的C++编译器环境:)可以直接使用:) <br>这个包包含的文件列表: <br>MinGW GNU的C/C++编译程序(windows版本) bison.exe GNU的yacc程序 bison.hairy GNU的yacc程序...
Flex和Bison是为编译器和解释器的编程人员特别设计的工具,其前身分别是lex和Yacc,该压缩包中包含了适合于Windows系统的Flex和Bison程序,版本分别是较新的2.5.37和2.7,解压后需要将Flex和Bison的exe文件路径添加...
2020_1.5:简单的lex + yacc示例(C) 2020_2:简单的lex + yacc计算器(C) goyacc1:简单的goyacc示例(Go) goyacc2:简单的goyacc example2(Go) goyacc3:另一个带有解析器和表达式的goyacc示例(Go) ...