栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > C/C++/C#

编译原理-递归下降语法分析(C++)

C/C++/C# 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

编译原理-递归下降语法分析(C++)

实验题目

编写识别由下列文法G[E]所定义的表达式的递归下降语法分析器。
E → E + T ∣ E − T ∣ T E rightarrow E+T | E-T | T E→E+T∣E−T∣T
T → T ∗ F ∣ T / F ∣ F T rightarrow T*F | T/F |F T→T∗F∣T/F∣F
F → ( E ) ∣ i F rightarrow (E) | i F→(E)∣i
输入:含有十进制数或十六进制数的表达式,如:75+(1ah-3*2)+68/2#。
输出:语法正确或语法错误信息。

题目分析

这次实验的重点在于理解递归下降语法分析的代码实现,意在将文法当中的每一种符号利用函数进行封装,然后在符合语法的条件下进行互相调用,完成递归下降语法分析。

难点在于需要对实验1的代码进行微调,达到将含有十进制数或十六进制数的表达式转换为对应的含i的表达式

C++

程序流程图如下:

#include 
#include 
#include 
#include 
#include 
#define digit 1 // 1数字
#define space 2 // 2空格
#define Hh 3 // 3Hh
#define AF 4 // 4A-F
#define letter 5 //5其它字母
#define op 6
using namespace std;

char sym; // 保存当前读入字符 
string line; // 保存读入的一行表达式
int cur; // 表达式字符串中的当前下标
int error; // 错误标志。0:正确; -1:错误
char q; // 指向输入符号串中当前的字符
char word[20]; // 存储当前识别的单词
int state; // 表示所处的状态
int i; // 单词的下标

int E(), E1(), T(), T1(), F(); // 函数声明
char read(string line, int k);
string change_i(string words); // 将含有十进制或十六进制数的表达式转换为用i代替的表达式
int isDigitOrChar(char ch);

int main() {
	ifstream fin("D:/Compile_exp/exp2-test.txt");
	if (!fin.is_open()) {
		cout << "open file error." << endl;
		_getch();
		return -1;
	}

	while (getline(fin, line)) {
		puts("------------------------------------");
		cur = 0;
		error = 0;
		string temp = line;
		line = change_i(line);
		if (line == "-1") {
			cout << temp << " is not a valid express." << endl;
			continue;
		}
		cout << "Output string is: " << line << endl;

		sym = read(line, cur); // 读取第一个字符
		E();

		if (error == -1)
			cout << temp << " is not valid." << endl;
		else if (error == 0)
			cout << temp << " is valid." << endl;
	}

	fin.close();
	_getch();

	return 0;
}

// 递归分析函数实现
int E() {
	T();
	E1();

	return 0;
}

int E1() {
	if (sym == '+' || sym == '-') {
		cur++;
		sym = read(line, cur);
		T();
		E1();
	}
	else if (sym == '#' || sym == ')')
		return 0;
	else
		error = -1;

	return 0;
}


int T() {
	F();
	T1();

	return 0;
}

int T1() {
	if (sym == '*' || sym == '/') {
		cur++;
		sym = read(line, cur);
		F();
		T1();
	}
	else {
		if (sym == '#' || sym == ')' || sym == '+' || sym == '-')
			return 0;
		else
			error = -1;
	}
	return 0;
}


int F() {
	if (sym == 'i') {
		cur++;
		sym = read(line, cur);
	}
	else if (sym == '(') {
		cur++;
		sym = read(line, cur);
		E();
		if (sym == ')') {
			cur++;
			sym = read(line, cur);
		}
		else
			error = -1;
	}
	else
		error = -1;

	return 0;
}

char read(string line, int k) {
	return line[k];
}

int isDigitOrChar(char ch) {
	if (ch >= 48 && ch <= 57) // 数字
		return digit;
	else if (ch == 32) // 空格 
		return space;
	else if (ch == 72 || ch == 104) // H or h
		return Hh;
	else if ((ch >= 65 && ch <= 70) || (ch >= 97 && ch <= 102)) // 字母A,B,C,D,E,F
		return AF;
	else if ((ch >= 65 && ch <= 90) || (ch >= 97 && ch <= 122)) // 除A~F外的其它字母
		return letter;
	else if (ch == '+' || ch == '-' || ch == '*' || ch == '/' || ch == '(' || ch == ')' || ch == '#')
		return op;
}

// 将含有十进制或十六进制数的表达式转换为用i代替的表达式
string change_i(string words) {
	memset(word, 0, sizeof word);
	state = 0;
	i = 0;
	cout << "Input string is: " << words << endl;

	string result = "";
	int cnt = 0;
	q = words[cnt++];

	while (cnt <= words.size()) {
		// 先判断状态,再判断字符
		switch (state) {
		case 0: // 0状态
			//puts("状态0");
			switch (isDigitOrChar(q)) {
			case digit: // 数字
				word[i++] = q;
				state = 2; // 转移到2状态
				break;
			case Hh: // H or h
			case AF: // 字母A,B,C,D,E,F or a,b,c,d,e,f
			case letter: // 字母
				word[i++] = q;
				state = 1;
				break;
			case op: // 空格
				result += q;
				state = 0;
				break;
			default: // 其它(非法字符 )
				word[i++] = q;
				state = 5;
			}
			break;
		case 1: // 1状态
			switch (isDigitOrChar(q)) {
			case Hh: // 当前状态遇到字母、数字往下读入
			case AF:
			case digit:
			case letter:
				word[i++] = q;
				state = 1;
				break;
			case op: // 读入完毕,识别为标识符
				word[i] = '';
				printf("%s is an identifier.n", word);
				//result += "i";
				memset(word, 0, sizeof word);
				i = 0;
				state = 0;
				break;
			default:
				word[i++] = q;
				state = 5;
			}
			break;
		case 2: // 2状态
			//puts("状态2");
			//printf("%sn", word);
			switch (isDigitOrChar(q)) {
			case digit: // 若为数字,不改变状态往下读入
				word[i++] = q;
				state = 2;
				break;
			case Hh: // 若为Hh,转移至状态3
				word[i++] = q;
				state = 3;
				break;
			case AF: // 若为AF,则有可能是16进制,转移至状态4
				word[i++] = q;
				state = 4;
				break;
			case op: // 成功识别为整数
				word[i] = '';
				printf("%s is an Integer.n", word);
				result += "i";
				result += q;
				//cout << result << endl;
				memset(word, 0, sizeof word);
				i = 0;
				state = 0;
				break;
			default:
				word[i++] = q;
				//printf("%sn", word);
				state = 5;
			}
			break;
		case 3: // 3状态
			switch (isDigitOrChar(q)) {
			case op: // 识别为16进制数
				word[i] = '';
				printf("%s is a Hex digit.n", word);
				result += "i";
				result += q;
				//cout << result << endl;
				memset(word, 0, sizeof word);
				i = 0;
				state = 0;
				break;
			default:
				word[i++] = q;
				state = 5;
			}
			break;
		case 4: // 4状态
			//puts("当前状态为4");
			switch (isDigitOrChar(q)) {

			case digit: // 若为数字或A~F,仍为状态4,往下读入
			case AF:
				word[i++] = q;
				state = 4;
				break;
			case Hh:
				word[i++] = q;
				state = 3;
				break;
			case op: // 如果16进制没有以h或H结尾,转移至错误状态
				state = 5;
				cnt--;
				break;
			default:
				word[i++] = q;
				state = 5;
			}
			break;
		case 5: // 出错状态
			//puts("状态5");
			//printf("%sn", word);
			if (isDigitOrChar(q) == op) { // 若为空格,则识别为非标识符
				word[i] = '';
				printf("%s is not an identifier.n", word);
				memset(word, 0, sizeof word);
				i = 0;
				state = 0;
				result = "-1";
				return result;
			}
			else { // 出错序列还未读取完毕,往下读入
				word[i++] = q;
				q = words[cnt++];
				continue;
			}
			break;
		}
		q = words[cnt++]; // 指针下移(指向输入符号串中的下一个字符)
	}

	return result;
}
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/861505.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号