编译原理实验报告5-语法分析程序的设计(2).doc
《编译原理实验报告5-语法分析程序的设计(2).doc》由会员分享,可在线阅读,更多相关《编译原理实验报告5-语法分析程序的设计(2).doc(16页珍藏版)》请在咨信网上搜索。
. 实验5 语法分析程序的设计(2) 一、实验目的 通过设计、编制、调试一个典型的语法分析程序,实现对词法分析程序所提供的单词序列进行语法检查和结构分析,进一步掌握常用的语法分析中算法优先分析方法。 二、实验内容 设计一个文法的算法优先分析程序,判断特定表达式的正确性。 三、实验要求 1、给出文法如下: G[E] E->T|E+T; T->F|T*F; F->i|(E); 可以构造算符优先表如下: + * ( ) i + * ( ) i 2、计算机中表示上述优先关系,优先关系的机内存放方式有两种1)直接存放,2)为优先关系建立优先函数,这里由学生自己选择一种方式; 1、 给出算符优先分析算法如下: k:=1; S[k]:=‘#’; REPEAT 把下一个输入符号读进a中; IF S[k]∈VT THEN j:=k ELSE j:=k-1; WHILE S[j] a DO BEGIN REPEAT Q:=S[j]; IF S[j-1]∈VT THEN j:=j-1 ELSE j:=j-2 UNTIL S[j] Q 把S[j+1]…S[k]归约为某个N; k:=j+1; S[k]:=N; END OF WHILE; IF S[j] a OR S[j] a THEN BEGIN k:=k+1;S[k]:=a END ELSE ERROR UNTIL a=‘#’ 1、 根据给出算法,利用适当的数据结构实现算符优先分析程序; 2、 利用算符优先分析程序完成下列功能: 1) 手工将测试的表达式写入文本文件,每个表达式写一行,用“;”表示结束; 2) 读入文本文件中的表达式; 3) 调用实验2中的词法分析程序搜索单词; 4) 把单词送入算法优先分析程序,判断表达式是否正确(是否是给出文法的语言),若错误,应给出错误信息; 5) 完成上述功能,有余力的同学可以对正确的表达式计算出结果。 四、实验环境 PC微机 DOS操作系统或 Windows 操作系统 Turbo C 程序集成环境或 Visual C++ 程序集成环境 五、实验步骤 1、 分析文法中终结符号的优先关系; 2、 存放优先关系或构造优先函数; 3、利用算符优先分析的算法编写分析程序; 4、写测试程序,包括表达式的读入和结果的输出; 5、程序运行效果,测试数据可以参考下列给出的数据。 六、测试数据 输入数据: 编辑一个文本文文件expression.txt,在文件中输入如下内容: 10; 1+2; (1+2)*3+(5+6*7); ((1+2)*3+4; 1+2+3+(*4+5); (a+b)*(c+d); ((ab3+de4)**5)+1; 正确结果: (1)10; 输出:正确 (2)1+2; 输出:正确 (3)(1+2)*3+(5+6*7); 输出:正确 (4)((1+2)*3+4 输出:错误 (5)1+2+3+(*4+5) 输出:错误 (6)(a+b)*(c+d) 输出:正确 (7)((ab3+de4)**5)+1 输出:错误 七、实验报告要求 实验报告应包括以下几个部分: 1、 给定文法优先关系和存放方式; + * ( ) i # + * ( e1 ) e2 e2 i e2 e2 # e3 e4 引入“#”,将句型包含起来并填入出错标记。使用二维数组将其存放。 2、 算符优先分析程序的算法和结构; 程序从文本文件中逐行读取表达式,每行以“;”做标记。调用词法分析程序将这行数据分析出由一个个的单词组成的表达式,再逐个分析单词。另外,由于文法中没写入关于标识符和常数的产生式,所以在对单词符号进行语法分析时,会将标识符和常数自动规约为“i”。 数据结构: 优先关系表R:二维数组,存储了终结符+、*、(、)、i、#的优先关系。 符号W:结构体,有四个成员,包括: ch:char类型,非终结符与终结符的字符标记; po:int类型,只对终结符有效,与在R中的位置有关,有词法分析器提供;对于非终结符,其po无效; val:string类型,综合属性;对终结符i,其值由词法分析器提供;对非终结符,其值由规约时对应的产生式的规则计算得到;对界符或运算符,val无效; type:int类型,标记属性值类型,0为标识符,不可计算;1为可计算的数值;由词法分析器提供; 注意:程序内部数值的计算和标记一律使用十进制,文本中的表达式必须为十进制整数,即如果在文本中使用八进制或十六进制,词法分析器分析后不会添加至缓冲区,在表达式语法正确且其中不含标志符时,计算得到的结果一律使用十进制。 例:对于文本中十进制数字10,其对应的初始结构体成员的值ch=’i’,po=5,val=”10”,type=1。 符号栈S:符号结构体的一维数组。 算法: 说明 : G[E] E->T|E+T; T->F|T*F; F->i|(E); 算符优先文法并未对非终结符定义优先关系,无法对单非产生式进行规约,所以实际上在规约时,上面的E->T,T->F基本没有使用,而且规约时并不严格按照产生式的右部规约,只要待规约项符合句型#N1a1N2a2…NnanNn+1#(每个ai都是终结符,Ni是可有可无的非终结符), 并且相对产生式,在相同位置有相同的非终结符即可规约,这样算符优先文法规约很快,但有些语法错误将无法识别,在本实验中,只要在要规约的地方准确的判断可规约的项,即符合句型,在不严格要求非终结符相同而终结符位置符号相同时,存在可匹配文法的产生式,即可规约,例如:F * F 可以匹配T*F继而规约为T。 定义用W[ch]表示字符名为ch的符号;实际程序中关于终结符优先关系的比较是利用R获取优先关系标志的,算法中为了可读性,直接将结构体进行比较了。 从文本文件读入一行数据,反复调用scanP()得到符号集合,用符号结构体数组E存储; k = 1; i = 0; S[k] = W[#]; Do { A = E[i++]; if(S[k] 是终结符) j = k; else j = k – 1; while(S[j] > A) { Do { Q = S[j]; If(S[j - 1] 是终结符) j = j – 1; else j = j – 2; }while(S[j] < Q); N = Statute(S,j + 1,k); k = j + 1; S[k] = N; } If(S[j] < A || S[j] == A) { k++; S[k] = A; } else error(S[j].po,A.po); }while(A == W[#]); 程序功能说明: 程序从文本文件读入表达式,判断语法是否正确,正确则输出结果,其中有标识符的话,结果还是含有标识符的原表达式,语法错误的话,则输出错误信息。 源程序: 程序中文本文件在桌面文件名为expression.txt #include<iostream> #include<string> #include<stdlib.h> using namespace std; #define NULL 0 #define MAXSIZE 30 //单行表达式的符号总数最大值 typedef struct grammar_symbol //文法符号 { char ch; int po; string val; int type; }W; char pre[6][6] = { //优先关系表 { '>', '<', '<', '>', '<','>' }, { '>', '>', '<', '>', '<', '>' }, { '<', '<', '<', '=', '<', '1' }, { '>', '>', '2', '>', '2', '>' }, { '>', '>', '2', '>', '2', '>' }, { '<', '<', '<', '3', '<', '=' } }; char GetChar(FILE* fp) { //读取文件中的一个字符 char ch; ch = fgetc(fp); return ch; } char GetBC(FILE* fp) { //读取文件的字符直至ch不是空白 char ch; do { ch = GetChar(fp); } while (ch == ' ' || ch == '\t' || ch == '\n'); return ch; } void Concat(char ch, char strToken[]) { //将ch中的字符连接到strToken之后 char str[2]; int len = strlen(strToken); strToken[len] = ch; strToken[len + 1] = '\0'; } int IsLetter(char ch) { //布尔函数,判断ch中的字符是否为字母,是返回1,否则返回0 int flag = 0; if (ch >= 'a' && ch <= 'z') flag = 1; return flag; } int IsDigit(char ch) { //布尔函数,判断ch中的字符是否为数字,是返回1,否则返回0 int flag = 0; if (ch >= '0' && ch <= '9') flag = 1; return flag; } int Reserve(char strToken[]) { //整型函数,对strToken中的字符串查找保留字表,若它是一个保留字则返回它的编码,否则返回0 int code = 0, i; char keyWord[6][6] = { "if", "then", "else", "while", "do" }; for (i = 0; i < 5; i++) { if (strcmp(strToken, keyWord[i]) == 0) { code = i + 1; break; } } return code; } int SearchOP(char ch) { //整型函数,对strToken中的字符串查找运算符和界符,若它是一个运算符或界符,则返回它的编码,否则返回0 int code = 0, i; char OP[10] = { '+', '*',' (', ')', '-', '/', '<', '>', '=', ';' }; for (i = 0; i < 10; i++) { if (ch == OP[i]) { code = i + 1; break; } } return code; } char Retract(FILE* fp, char ch) { //子函数,将搜索指示器回调一个字符位置,将ch置为空白字符 ch = ' '; fseek(fp, -1L, 1); return ch; } void ProError() { //错误处理函数 printf("输入错误!\n"); return; } int scan(FILE* fp,W* E,int num) { W w; char ch; char strToken[10]; strToken[0] = '\0'; //置strToken为空串 ch = GetBC(fp); //先读取一个非空白的字符 if (feof(fp)) return 0; if (ch == ';'){ printf(";"); return 0; //判断表达式尾,是则返回调用程序 } if (IsLetter(ch)) { //判断标识符 while (IsLetter(ch) || IsDigit(ch)) { Concat(ch, strToken); ch = GetChar(fp); } ch = Retract(fp, ch); if (Reserve(strToken)) { //判断关键字 printf("<%s,->\n", strToken); } else //判断标识符 { printf("%s", strToken); w.ch = 'i'; w.po = 4; w.val = strToken; w.type = 0; E[num] = w; } } else if (ch >= '1' && ch <= '9') { //判断十进制整数 while (IsDigit(ch)) { Concat(ch, strToken); ch = GetChar(fp); } ch = Retract(fp, ch); printf("%s", strToken); w.ch = 'i'; w.po = 4; w.val = strToken; w.type = 1; E[num] = w; } else if (ch == '0') { ch = GetChar(fp); if (ch >= '1' && ch <= '7') { //判断八进制整数 while (ch >= '0' && ch <= '7') { Concat(ch, strToken); ch = GetChar(fp); } ch = Retract(fp, ch); printf("<2,%s>\n", strToken); } else if (ch == 'x') { //判断十六进制整数 ch = GetChar(fp); while (IsDigit(ch) || ch >= 'a' && ch <= 'f') { Concat(ch, strToken); ch = GetChar(fp); } ch = Retract(fp, ch); printf("<3,%s>\n", strToken); } else { //判断十进制的0 ch = Retract(fp, ch); printf("0"); w.ch = 'i'; w.po = 4; w.val = "0"; w.type = 0; E[num] = w; } } else if (SearchOP(ch) != 0) { //判断运算符和界符 printf("%c", ch); int po = SearchOP(ch) - 1; w.ch = ch; w.po = po; E[num] = w; } else { //出错 ProError(); } return 1; } bool checkVt(char ch) { bool flag = false; int i; char Vt[6] = { '+', '*', '(', ')', 'i', '#' }; for (i = 0; i < 6; i++) { if (ch == Vt[i]) { flag = true; } } return flag; } W Statute(W* S, int s, int e) { //规约子函数,将S中j+1到k的符号规约为N W N; if (S[s].ch == 'i' && s == e) { N.ch = 'F'; N.val = S[s].val; N.type = S[s].type; } else if (S[s].ch == '(' && !(checkVt(S[s + 1].ch)) && S[e].ch == ')') { if (S[s + 1].type == 1) { N.ch = 'F'; N.val = S[s + 1].val; N.type = S[s + 1].type; } else { N.ch = 'F'; N.val = '('+ S[s + 1].val + ')'; N.type = S[s + 1].type; } } else if (!(checkVt(S[s].ch)) && S[s + 1].ch == '+' && !(checkVt(S[e].ch))) { N.ch = 'E'; if (S[s].type == 1 && S[e].type == 1) { N.type = 1; int v = atoi(S[s].val.data()) + atoi(S[e].val.data()); char l[30]; sprintf_s(l,30,"%d", v); N.val = l; } else { N.type = 0; N.val = S[s].val + S[s + 1].ch + S[e].val; } } else if ((s != e) && !(checkVt(S[s].ch)) && S[s + 1].ch == '*' && !(checkVt(S[e].ch))) { N.ch = 'T'; if (S[s].type == 1 && S[e].type == 1) { N.type = 1; int v = atoi(S[s].val.data()) * atoi(S[e].val.data()); char l[30]; sprintf_s(l, 30,"%d", v); N.val = l; } else { N.type = 0; N.val = S[s].val + S[s + 1].ch + S[e].val; } } else if(S[s].ch == 'T' && s == e){ N.ch = 'E'; N.val = S[s].val; N.type = S[s].type; } else { N.ch = '#'; } N.po = 4; return N; } void error(char errnum) { //错误处理子函数 if (errnum == '1') { printf("错误,非法左括号\n\n"); } else if(errnum == '2'){ printf("错误,缺少运算符\n\n"); } else if (errnum == '3'){ printf("错误,非法右括号\n\n"); } else if (errnum == '4'){ printf("错误,缺少表达式\n\n"); } } int syntax(W* E,int num) { //算法对应的主要实现程序 W S[MAXSIZE]; int k = 1, i = 0, j; W border, A, Q; border.ch = '#'; border.po = 5; E[num] = border; S[k] = border; do { A = E[i++]; if (checkVt(S[k].ch)) //判断S[k]是终结符 j = k; else j = k - 1; while (pre[S[j].po][A.po] == '>') { do { Q = S[j]; if (checkVt(S[j - 1].ch)) j = j - 1; else j = j - 2; } while (pre[S[j].po][Q.po] != '<'); W N = Statute(S, j + 1, k); if (N.ch == '#') { error('4'); return 0; } k = j + 1; S[k] = N; } if (pre[S[j].po][A.po] == '<' || pre[S[j].po][A.po] == '=') { k++; S[k] = A; } else { error(pre[S[j].po][A.po]); return 0; } } while (A.ch != '#'); if (A.ch == '#') { printf("正确,结果为:%s\n\n", S[k - 1].val.data()); return 0; } } int main() { FILE* fp; errno_t err; if ((err = fopen_s(&fp,"C:\\Users\\Administrator\\Desktop\\expression.txt", "r")) != NULL) { //以只读方式打开文件,失败则退出程序 printf("file can not open!"); exit(0); } int n = 0; printf("语法分析结果如下:\n\n"); while (!feof(fp)) { //若不是文件尾则执行循环 int num = 0; W E[MAXSIZE]; //存储一行表达式 GetBC(fp); if (!feof(fp)) { n++; fseek(fp, -1L, 1); printf("(%d)", n); } else { break; } while (1) { //只读一行,行末标志为“;” int flag = scan(fp, E,num); if (flag == 0) break; num++; } printf("\n输出:"); syntax(E,num); } fclose(fp); //关闭文件 fp = NULL; //避免指向非法内存 } 3、 程序运行流程; 输入表达式到文本 程序开始 是否是文件尾 读取一行文本 否 调用syntax()判断语法是否正确 输出结果 是 否 输出错误 返回 退出程序 是 4、 程序的测试结果和问题; 实验报告源数据: 其它数据: 问题: 实验时是根据实验报告提供的算法编程的,但是原算法使用了类似Pascal的语言,而我用的是C,算法实现时具体的语法不同,例如Pascal的repeat…until与C语言的do…while并一样,实验时不注意会使程序出错,二者的循环条件是相反的。 编程时,误将终结符数组的左右括号输入成了中文的括号,导致在判断是否为终结符时,英文的左右括号无法与中文的括号匹配,程序出现了错误,虽然调试时很容易就发现了,但这样的细节问题不应该费时间要调试才解决,这提醒我编程时更应该认真仔细,效率才能得到保证。 另外,语法错误时,这一行表达式的分析就可以直接终止但此时程序是在两层循环里面,只有跳出这两层循环才会终止,而break则只能跳出一层,若在最后一层使用标志,再跳出一层,这就导致之后的每一行都会多做一次判断,而我又不想使用goto,所以最后我决定使用子函数,将语法分析的主要程序段放在子函数中,有语法错误,直接return就可以了。 5、 实验总结。 本次实验有之前的词法分析程序和已经提供的算法作基础,编写起来并不难,就是要注意算符优先文法本身的优缺点,它忽略右部只有一个非终结符的产生式,而且规约的时候主要还是匹配终结符,由于这个原因,规约很快,但有些语法错误的表达式会误认为句子,所以在在原本算法的第十一步,规约的具体步骤要按具体的文法来完成,其中要包括没有匹配时对应的错误处理。实验的最主要部分的算法很容易实现,主要是如何正确的完成规约,并将正确的句子的结果计算出来,此处是借助于结构体,在每个规约步骤中,加上对应的计算规则,即可完成。通过这个,再次让我明白,编程时,设计好算法和数据结构事半功倍。 部分内容来源于网络,有侵权请联系删除!- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 编译 原理 实验 报告 语法分析 程序 设计
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文