社区
C语言
帖子详情
词法分析程序c语言实现(请各位高手帮帮忙)
yaogip
2007-05-25 03:26:43
选取无符号数的算术四则运算中的各类单词为识别对象,要求将其中的各个单词识别出来。
输入:由无符号数和+,—,*,/, ( , ) 构成的算术表达式。
输出:单词串的输出形式,所输出的每一单词均按形如(CLASS,VALUE)的二元式编码。
单词符号 类别码(CLASS) 单词值(VALUE)
无符号数 1 数字值
+ 2 无值
— 3 无值
* 4 无值
/ 5 无值
( 6 无值
) 7 无值
...全文
774
3
打赏
收藏
词法分析程序c语言实现(请各位高手帮帮忙)
选取无符号数的算术四则运算中的各类单词为识别对象,要求将其中的各个单词识别出来。 输入:由无符号数和+,—,*,/, ( , ) 构成的算术表达式。 输出:单词串的输出形式,所输出的每一单词均按形如(CLASS,VALUE)的二元式编码。 单词符号类别码(CLASS)单词值(VALUE) 无符号数 1 数字值 + 2 无值 — 3 无值 * 4 无值 / 5 无值 ( 6 无值 ) 7 无值
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
3 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
rabbit5455
2007-05-25
打赏
举报
回复
我最近在做一个正则表达式的解析工具,
里面有一部分是分析词法的代码:
在我的博客中,有一张UML状态图和一个getSymbol()函数:
http://hi.baidu.com/rabbit5455/blog/item/5b94bc02b2bd080e4bfb511c.html
代码如下:
/*词法分析,取得一个符号*/
SymbolType getSymbol() {
char *cc = &g_symbol_charvalue;
char tmp; /*临时变量*/
*cc = g_strRegExp[++g_scan_pos];
if ((*cc>='0' && *cc<='9') || (*cc>='a' && *cc<='z') || (*cc>='A' && *cc<='Z')) {
return g_symbol_type=INPUT_ELE;
}
/*正则表达式结尾*/
if (*cc == NULL) {return g_symbol_type=END_REGEXP;}
if (*cc == '(') {return g_symbol_type=AND_MACHINE_BEGIN;}
if (*cc == ')') {return g_symbol_type=AND_MACHINE_END;}
if (*cc == '[') {return g_symbol_type=OR_MACHINE_BEGIN;}
if (*cc == ']') {return g_symbol_type=OR_MACHINE_END;}
if (*cc == '|') {return g_symbol_type=BACKTRACE;}
if (*cc == '^') {return g_symbol_type=NOT_OP;}
if (*cc == '.') {return g_symbol_type=DOT;}
/*转义字符*/
if (*cc == '\\') {
*cc = g_strRegExp[++g_scan_pos];
if (*cc == 'd') {return g_symbol_type=NUMBER;}
if (*cc == 'D') {return g_symbol_type=NOT_NUMBER;}
if (*cc == 'f') {*cc = '\f'; return g_symbol_type=INPUT_ELE;}
if (*cc == 'n') {*cc = '\n'; return g_symbol_type=INPUT_ELE;}
if (*cc == 'r') {*cc = '\r'; return g_symbol_type=INPUT_ELE;}
if (*cc == 't') {*cc = '\t'; return g_symbol_type=INPUT_ELE;}
if (*cc == 'v') {*cc = '\v'; return g_symbol_type=INPUT_ELE;}
if (*cc == 's') {return g_symbol_type=ALL_SPACE;}
if (*cc == 'S') {return g_symbol_type=NOT_ALL_SPACE;}
if (*cc == 'w') {return g_symbol_type=AZaz09_;}
if (*cc == 'W') {return g_symbol_type=NOT_AZaz09_;}
/*16进制*/
if (*cc == 'x') {
tmp = g_strRegExp[++g_scan_pos];
if (tmp>='0' && tmp<='9') {
*cc = tmp - '0';
} else if (tmp>='a' && tmp<='f') {
*cc = tmp - 'a' + 10;
} else if (tmp>='A' && tmp<='F') {
*cc = tmp - 'A' + 10;
} else {
/*不是16进制数字,返回原字符'x'*/
g_scan_pos--;
return g_symbol_type=INPUT_ELE;
}
tmp = g_strRegExp[++g_scan_pos];
if (tmp>='0' && tmp<='9') {
*cc *= 16;
*cc += tmp - '0';
} else if (*cc>='a' && *cc<='f') {
*cc *= 16;
*cc += tmp - 'a' + 10;
} else if (*cc>='A' && *cc<='F') {
*cc *= 16;
*cc += tmp - 'A' + 10;
} else {
/*这个不是16进制数字,只有一位:\xF*/
g_scan_pos--;
return g_symbol_type=INPUT_ELE;
}
return g_symbol_type=INPUT_ELE;
}
/*8进制*/
if (*cc>='0' && *cc<='3') {
*cc -= '0';
tmp = g_strRegExp[++g_scan_pos];
if (tmp>='0' && tmp<='7') {
*cc *= 8;
*cc += tmp - '0';
} else {
/*只有一位8进制数字:\7*/
g_scan_pos--;
return g_symbol_type=INPUT_ELE;
}
tmp = g_strRegExp[++g_scan_pos];
if (tmp>='0' && tmp<='7') {
*cc *= 8;
*cc += tmp - '0';
} else {
/*只有两位8进制数字:\77*/
g_scan_pos--;
return g_symbol_type=INPUT_ELE;
}
return g_symbol_type=INPUT_ELE;
}
if (*cc>='4' && *cc<='7') {
*cc -= '0';
tmp = g_strRegExp[++g_scan_pos];
if (tmp>='0' && tmp<='7') {
*cc *= 8;
*cc += tmp - '0';
} else {
/*只有一位8进制数字:\7*/
g_scan_pos--;
return g_symbol_type=INPUT_ELE;
}
return g_symbol_type=INPUT_ELE;
} else {
/*[^x0-7dDfnrtvsSwW]*/
return g_symbol_type=INPUT_ELE;
}
}
/*重复运算*/
if (*cc == '*') {return g_symbol_type=REPEAT_ZERO_MORE;}
if (*cc == '+') {return g_symbol_type=REPEAT_ONCE_MORE;}
if (*cc == '?') {return g_symbol_type=REPEAT_ZERO_ONCE;}
if (*cc == '{') {
*cc = g_strRegExp[++g_scan_pos];
if (*cc>'9' || *cc<'0') {return g_symbol_type=UNKNOWN;}
g_repeat_m = 0; /*取{m,n}的m*/
while (*cc>='0' && *cc<='9') {
g_repeat_m *= 10;
g_repeat_m += *cc-'0';
*cc = g_strRegExp[++g_scan_pos];
}
/*{m}*/
if (*cc == '}') {return g_symbol_type=REPEAT_RANGE_M;}
if (*cc != ',') {return g_symbol_type=UNKNOWN;}
*cc = g_strRegExp[++g_scan_pos];
/*{m,}*/
if (*cc == '}') {return g_symbol_type=REPEAT_RANGE_M_MORE;}
/*{m,n}*/
if (*cc>'9' || *cc<'0') {return g_symbol_type=UNKNOWN;}
g_repeat_n = 0; /*取{m,n}的n*/
while (*cc>='0' && *cc<='9') {
g_repeat_n *= 10;
g_repeat_n += *cc-'0';
*cc = g_strRegExp[++g_scan_pos];
}
if (*cc == '}') {
return g_symbol_type=REPEAT_RANGE_MN;
} else {
return g_symbol_type=UNKNOWN;
}
}
return g_symbol_type=UNKNOWN;
}
================================================
E-mail:qfhuazi@163.com
todototry
2007-05-25
打赏
举报
回复
fstream类和string类,查msdn看看,即可以okokok
todototry
2007-05-25
打赏
举报
回复
看看文件操作,字符串操作
MD5算法
C语言
实现
课程名称:
C语言
实现
MD5算法 应用知识:
C语言
基础知识:流程结构,文件操作,位运算,函数,宏... 课程目的: 1、练习
C语言
知识综合运用 2、巩固
C语言
基础知识 3、了解MD5算法的基本原理 课程特点: 1、知识点讲解...
请
各位
C语言
高手
帮帮忙
!
我现在十分茫然,我要编写一个
词法分析
器,要求如下: 1) 输入为单词组成的文本文件 2) 提取文本中的单词 单词由如下字符组成:字母、数字、下划线、减号 单词之间
C语言
基础知识
请
各位
高手
帮帮忙
~~ 解释清楚为什么? 答: 把 0 到 4294967295 按顺序排列成一个 “ 环形 ” ,则 0 两边的数就是 1 和 4294967295, 如果 无符号整型 在使用中没有超出范围,那么结果都是正确的,如果超出了...
C/C++ C++ / 面向对象
对象与类 成员函数、全局函数和友元函数的差别?... 关于const 在const reference parameter中使用的大不解 C++中虚函数和纯虚函数的概念,差别和分别存在的原因 为何析构函数中的cout不起作用
请
高手
介绍一
C/C++ C++ / 面向对象 FAQ
C/C++ C++ / 面向对象 对象与类 成员函数、全局函数和友元函数的差别... 关于const 在const reference parameter中使用的大不解 C++中虚函数和纯虚函数的概念,差别和分别存在的原因 为何析构函数中的cout不起作用
请
高
C语言
69,336
社区成员
243,078
社区内容
发帖
与我相关
我的任务
C语言
C语言相关问题讨论
复制链接
扫一扫
分享
社区描述
C语言相关问题讨论
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章