资源描述:
《编译原理 词法分析程序》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、编译原理实验报告词法分析器姓名:李慧琳班级:计科0903学号:0908030309日期:2012年10月1.题目要求:1.1待分析的简单词法(1)关键字beginifthenwhiledoend(所有的关键字都是小写。)(2)运算符和界符=+-*/<<=<>>>==;()#(3)其他单词的标识符标识符ID=letter(letter
2、digit)*整型常数NUM=digitdigit*1.2各种单词符号对应的种别码单词符号种别码单词符号种别码bgin1:17If2:=18Then3<20wile4<>21do5<=22end6>23lettet(letter
3、digit)*10>=24
4、dightdight*11=25+13;26—14(27*15)28/16#01.3词法分析程序的功能输入:所给文法的源程序字符串。输出:二元组(syn,token或sum)构成的序列。其中syn为单词种别码;token为存放的单词自身字符串;sum为整型常数。例如:对源程序beginx:=9:ifx>9thenx:=2*x+1/3;end#的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……2.算法分析2.1主程序示意图置初值调用扫描子程序输出单词二元组输入串结束否是结束图1(1)关键字表的初值关键字作为特殊标识符
5、处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:Char*rwtab[6]={“begin”,“if”,“then”,“while”,“do”,“end”,};(2)程序中用到的主要变量syn,token和sum2.2扫描子程序的算法思想首先设置3个变量:①token用来存放构成单词符号的字符串;②sum用来整型单词;③syn用来存放单词符号的种别码。扫描子程序主要部分流程如图2所示。开始变量初始化忽略空格是否文件结束?返回是是否字母拼字符串数字其他运算
6、符、符号界符等符号是否关键字?返回拼数否对不同符号给出相应的syn值报错syn=10是syn=1111syn为对应关键字的单词种别码图23.程序#include#include#includecharprog[80],token[8],ch;intsyn,p,m,n,sum;char*rwtab[6]={"begin","if","then","while","do","end"};voidscaner();voidmain(){p=0;printf("pleaseinputastring(endwith'#'):/n");
7、do{scanf("%c",&ch);prog[p++]=ch;}while(ch!='#');p=0;do{scaner();switch(syn){case11:printf("(%-10d%5d)",sum,syn);break;case-1:printf("youhaveinputawrongstring");getchar();exit(0);default:printf("(%-10s%5d)",token,syn);break;}}while(syn!=0);getchar();}voidscaner(){sum=0;for(m=0;m<8;m++)token
8、[m++]=NULL;ch=prog[p++];m=0;while((ch=='')
9、
10、(ch==''))ch=prog[p++];if(((ch<='z')&&(ch>='a'))
11、
12、((ch<='Z')&&(ch>='A'))){while(((ch<='z')&&(ch>='a'))
13、
14、((ch<='Z')&&(ch>='A'))
15、
16、((ch>='0')&&(ch<='9'))){token[m++]=ch;ch=prog[p++];}p--;syn=10;for(n=0;n<6;n++)if(strcmp(token,rwtab[n])==0){syn=n+1;break;
17、}}elseif((ch>='0')&&(ch<='9')){while((ch>='0')&&(ch<='9')){sum=sum*10+ch-'0';ch=prog[p++];}p--;syn=11;}elseswitch(ch){case'<':token[m++]=ch;ch=prog[p++];if(ch=='='){syn=22;token[m++]=ch;}else{syn=20;p--;}break;case'>':token[