1、实验一 词法分析设计实验学时:4实验类型:综合实验要求:必修一、实验目的通过本实验的编程实践,使学生了解词法分析的任务,掌握词法分析程序设计的原理和构造方法,使学生对编译的基本概念、原理和方法有完整的和清楚的理解,并能正确地、熟练地运用。二、实验内容用VC+/VB/JAVA语言实现对 C语言子集的源程序进行词法分析。通过输入源程序从左到右对字符串进行扫描和分解,依次输出各个单词的内部编码及单词符号自身值;若遇到错误则显示“Error” ,然后跳过错误部分继续显示 ;同时进行标识符登记符号表的管理。以下是实现词法分析设计的主要工作:(1)从源程序文件中读入字符。(2)统计行数和列数用于错误单词的
2、定位。(3)删除空格类字符,包括回车、制表符空格。(4)按拼写单词,并用(内码,属性)二元式表示。( 属性值token的机内表示)(5)如果发现错误则报告出错(6)根据需要是否填写标识符表供以后各阶段使用。单词的基本分类: 关键字:由程序语言定义的具有固定意义的标识符。也称为保留字例如 if、 for、while、printf ; 单词种别码为1。 标识符:用以表示各种名字,如变量名、数组名、函数名; 常数: 任何数值常数。如 125, 1,0.5,3.1416; 运算符:+、-、*、/; 关系运算符: 、= 、=“,关键字表 , 单词种别码1; string Number100;常数表 单词
3、种别码5;string Identifier100;标示符表 单词种别码6;构造关键字判断函数Iskey(),字母判断函数Isletter(),数字判断函数Isnumber();构造标示符判别函数InsertId(),若输入的标示符在标示符数组Identifier 中,返回其下标,若不在,将该标示符插到数组末尾。构造标示符判别函数InsertNumber() ,若输入的数字在数字数组 Number中,返回其下标,若不在,将该数字插到数组末尾。具体分析函数analyse()具体实现输入源代码的识别。anaiyse()构造思路,程序设计图:综合以上分析,画出整个程序的运行分析程序图,如下:开始 输
4、入源文件路径路径是否有效是初始化文件指针否 将字符加入字符数组 W o r d 是空格 , 空白或换行吗是字母吗 是数字吗否 否 是界符吗否打开源文件跳过该字符是是文件结束 ?否将字符加入字符数组 W o r d 否将字符加入字符数组W o r d 是指向下一字符识别指针内容指向下一字符是字母惑数字吗是将 w o r d 与关键字表 k e y 进行匹配否匹配 ?是输出 w o r d为关键字输出 w o r d 为普通标示符否将字符加入字符数组 W o r d 指向下一字符输出 w o r d为常数识别指针内容回退是数字吗是否输出 w o r d为界符指向下一字符结束是输出 W o r d内
5、容为不可识别将字符加入字符数组W o r d 整个程序的运行分析程序图 软件的测试方法和测试结果:首先,将要分析的源代码写入一个文本,存于磁盘中,然后运行程序,输入源代码文件存放的路径,若输入路径正确,程序将自动分析源代码,若输入路径不正确,程序将显示,路径错误,请重新输入的提示。下面为具体的运行实例:源代码为:If i=0 then n+;a= 3b %)输出满足要求。 实验总结 (设计的特点、不足、收获与体会):通过此次实验,让我了解到如何设计、编制并调试词法分析程序,熟悉了构造词法分析程序的手工方式的相关原理,加深了对编译原理词法分析的理解,本次使用C+语言直接编写此法分析程序,也让我重
6、新熟悉了C+语言的相关内容,加深了对C+语言的用途的理解。本程序的数据输入采取直接从文件中读取,而不是由键盘输入,因此在测试过程中,输入得到大大简化,但是本程序的关键字表只初始化了一部分关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字),而且程序的测试数据存在不足,程序可能存在未发现的漏洞,以上两点有待改善。附录该程序的源代码:#include #includeusing namespace std;/数据定义#define MAX 33 char ch = ;static int line=1,row=0;int NumberCount=0,IdCount=0;string ke
7、y=“auto“,“break“,“case“,“catch“,“char“,“class“,“const“,“continue“,“default“,“delete“,“do“,“double“,“else“,“enum“,“float“,“for“,“if“,“int“,“long“,“new“,“private“,“protected“,“public“,“register“,“return“,“short“,“static“,“struct“,“switch“,“this“,“void“,“while“,“then“;/关键字表 单词种别码 1 string Delimiter=“;“
8、,“(“,“)“,“,“,“,“,“.“,“,“;/分界符表 单词种别码 2string Operator=“+“,“-“,“*“,“/“;/算术运算符表 单词种别码 3string R_operators=“,“=“;/关系运算符表 单词种别码 4string Number100;/常数表 单词种别码 5string Identifier100;/标示符表 单词种别码 6/数据分析int Iskey(string c) /关键字判断 int i;for(i=0;i=a)|(c=A) if(ch=A) ch=ch+32; /转换成小写return 1;else return 0;int IsNumber(char c) /判断是否为数字if(c=0if(ch=)cout=“=)“ )“)cout“)“tt关系运算符 “t(“line“,“row“)“endl;elsecout“tt( 4, )“tt关系运算符 “t(“line“,“row“)“endl;fseek(fpin,-1L,SEEK_CUR);break; default : coutch“ttError“ttError“tt(“line“,“row“)“endl;brea