This is bug, do you think so?

JXLFZ 2012-07-20 12:01:17
本帖要说的是在《c专家编程》一个程序里的bug(至于这个是不是就看下大家的看法,不过我觉得挺明显的,要不就是我班门弄斧了,哈哈),还有就是想给大家看下这段程序,这是一个关于解析c语言声明的程序。没放假前的一段时间,我在论坛里看到了不少人在讨论这个声明的问题,lz也给出了分析声明的方法,至于要不要用那些复杂的声明我就不发表意见了(因为我也没有什么经验),但我们总得看明白这些声明啊。我在那个时候刚把《c专家编程》这书看完了,相信看过这书的同学都知道,书里就有一章是关于声明的,里面还有两个用来解析声明的程序(另一个是在后面的章节用有限状态机实现的)。
其实要理解声明只要知道一些在声明里的优先级就行,饿...就不扯这个了,进入正题。这里准备说的程序是那个用有限状态机实现的那个(其实这个bug在第一个解析声明的程序也有,不过我觉得这个好玩些,也可以给一些不知道FSM的同学介绍一下这个概念)。
为了让大家都可以更好的理解这个程序,我先引用一下书里关于FSM(finite state machine)有限状态机的描述:有限状态机是一个数学概念,如果把它运用于程序中,可以发挥很大的作用。它是一种协议,用于有限数量的子程序(“状态”)的发展变化。每一个子程序进行一些处理并选择下一种状态(通常取决于下一段的输入)。有限状态机可以用于程序的控制结构。它的基本思路是用一张表保存所有可能的状态,并列出进入每个状态时可能执行的所有动作,其中最后一个动作就是计算(通常在当前状态和下一个输入字符的基础上,另外再经过一次表查询)下一个应该进入的状态。你从一个“初始状态”开始。在这过程中,翻译表可能会告诉你进入了一个错误的状态,表示一个预期之外的或错误的输入。你不停的在各种状态间进行转换,直到到达结束状态。
饿...扯了这么多,就想给不知道这个的人介绍一下这个概念。说回来,要用有限状态机实现,那就要有一个适合的状态机啊(当然书里都准备好了的),下面就给大家看一个神奇的玩意(好吧,我知道很多人都看过了,不过我还是要把它弄出来):



由于图大的问题,就分成了两部分,希望大家谅解!
这是一个可以用来分析c语言声明的环,只要按照它的步骤来就可以解析声明,它的原理就是基于声明的优先级:1.括号里的部分 2.后缀符号[]或() 3.前缀符号* ,和三个规定:1.函数不可以返回函数 2.函数的参数不可以是函数 3.数组的类型不可以是函数 (可以用指针来实现)。
再引用书里的一段描述:分析环是一个简单的状态机,它的绝大多数状态转换都是按连续的顺序进行的,与输入无关,这意味著不需要建立一个转换表用于匹配状态/输入以获得下一个状态。你可以用一个简单的变量(类型为函数指针)。在每种状态下,需要做的事情之一就是给下个一个状态赋值。在主循环中,程序将调用指针所指向的函数,并循环往复,直到结束函数被调用或遇到一个错误的状态。
好吧,终于把这些扯完了,我们可以这个分析环的步骤2,3,4,5看作是一种状态,6是结束状态。贴代码了,bug我在下面说。

// 用//是本人的注释

#include <stdio.h>
#include <string.h>
#include <ctype.h>
#define MAXTOKENS 100
#define MAXTOKENLEN 64
enum type_tag { IDENTIFIER, QUALIFIER, TYPE };
struct token{
char type;
char string[MAXTOKENLEN];
};
int top = -1;

//int t_num = 0; //本人的修改,可先不管

/*在第一个标识符(identifier)前保存所有的标识(token)*/
struct token stack[MAXTOKENS];
/*保存刚读入的标记*/
struct token this;
#define pop stack[top--]
#define push(s) stack[++top]=s
enum type_tag classify_string(void)
/*判断标识符的类型*/
{
char *s = this.string;
if(!strcmp(s,"const")){
strcpy(s,"read-only");
return QUALIFIER;
}
if(!strcmp(s,"volatile")) return QUALIFIER;
if(!strcmp(s,"void")) return TYPE;
if(!strcmp(s,"char")) return TYPE;
if(!strcmp(s,"signed")) return TYPE;
if(!strcmp(s,"unsigned")) return TYPE;
if(!strcmp(s,"short")) return TYPE;
if(!strcmp(s,"int")) return TYPE;
if(!strcmp(s,"long")) return TYPE;
if(!strcmp(s,"double")) return TYPE;
if(!strcmp(s,"struct")) return TYPE;
if(!strcmp(s,"union")) return TYPE;
if(!strcmp(s,"enum")) return TYPE;
return IDENTIFIER;
}

void gettoken(void)
{/*读入下一个标记,保存在“this”中*/
char *p = this.string;
/*略过所有的空白字符*/
while ((*p = getchar()) == ' ');
if(isalnum(*p)){
/*在标识符中读入A-Z,1-9字符*/
while (isalnum(*++p = getchar()));
ungetc(*p,stdin);
*p = '\0';
this.type = classify_string();
return;
}
this.string[1] = '\0';
this.type = *p;
return;
}

void initialize(), get_array(), get_params(), get_lparen(), get_ptr_part(), get_type();//各种状态
void (*nextstate)(void) = initialize;

int main()
/*用有限状态机实现的cdecl*/
{
/*在不同的状态间转换,直到指针为NULL*/
while(1){
while(nextstate != NULL) (*nextstate)();
nextstate = initialize;
fflush(stdin);
}
return 0;
}

void initialize()
{
gettoken();
while (this.type != IDENTIFIER){
push(this);
gettoken();
}
printf("%s is ", this.string);
gettoken();
nextstate = get_array;
}

void get_array() //状态1,也就是分析环里的步骤2
{
nextstate = get_params;
while (this.type == '['){
printf("array ");
gettoken();/*一个数字或']'*/
if(isdigit(this.string[0])){
printf("0..%d ",atoi(this.string)-1);
gettoken();/*读取']'*/
}
gettoken();/*在']'之后读取*/
printf("of ");
nextstate = get_lparen;
}
}

//状态2,也就是分析环里的步骤3。bug就在这个函数里,大家可以先看下
//这个程序是不对函数里的参数进行分析的
void get_params()
{
nextstate = get_lparen;
if(this.type == '('){
while(this.type != ')'){
gettoken();
}
gettoken();
printf("function returning ");
}
}

/*
void get_params() //这是我的修改,为了不影响代码的可读性,bug我在后面再分析了
{
nextstate = get_lparen;
if(this.type == '('){
t_num++;
while (t_num != 0){
gettoken();
if(this.type == '(') t_num++;
else if(this.type == ')') t_num--;
}
gettoken();
printf("function returning ");
}
}
*/

void get_lparen() //状态3,也就是分析环里的步骤4
{
nextstate = get_ptr_part;
if(top >= 0){
if(stack[top].type == '('){
pop;
gettoken();/*在'('之后读取*/
nextstate = get_array;
}
}
}

void get_ptr_part() //状态4,也就是分析环里的步骤5
{
nextstate = get_type;
if(stack[top].type == '*'){
printf("pointer to ");
pop;
nextstate = get_lparen;
}else if (stack[top].type == QUALIFIER){
printf("%s ",pop.string);
nextstate = get_lparen;
}
}

void get_type() //结束状态
{
nextstate = NULL;
/*处理在读入标识符之前被放在堆栈的所有标记*/
while (top >= 0){
printf("%s ",pop.string);
}
printf("\n");
}

/*******************************************************************************************
对bug的分析:
while(this.type != ')'){
gettoken();
出现问题的就是上面这一个循环语句,它这里只判断了是不是找到了右括号,但作者可能没想到这个
右括号可以不是匹配函数左括号的右括号,举个例子:int foo(int(*p)[10]),大家看这个就知道了这
个循环语句会在把数组指针括起来的右括号就终止了,但实际上它应该找到的是最右边那个函数的右
括号,就这bug产生了,后面的声明部分可能会被抛弃或错用。由此想到那个环对步骤3“如何阅读”的
描述:“到右括号为止的内容”也应该说成是和前面左括号匹配的右括号才对。
大家可以测试一下这个声明,信号函数:void (*signal(int sig, void(*func)))(int);
或者我随便写的一个: int (*foo(int(*p)(void)))[10];
至于我修改就是加了一个计数的变量,这样就可以准确找到对应的右括号了,当然可能会有更好
的方法,哈哈。
我写这个也不是贬低这本书,我知道我也没这个能力,这个只是我的一个发现,发上来和大家分
享一下而已。还有不得不说的就是《c专家编程》的确是一本好书,c语言进阶必备啊。。。哈哈!
*********************************************************************************************/


要是有错,请各位大大们指出哈。。。。。
...全文
339 14 打赏 收藏 转发到动态 举报
写回复
用AI写文章
14 条回复
切换为时间正序
请发表友善的回复…
发表回复
Universe_Admin 2012-07-21
  • 打赏
  • 举报
回复
[Quote=引用 13 楼 的回复:]
楼主对待学习的这种态度令人钦佩!
[/Quote]
+1
pathuang68 2012-07-21
  • 打赏
  • 举报
回复
楼主对待学习的这种态度令人钦佩!
JXLFZ 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 11 楼 的回复:]

比如gcc的源代码
[/Quote]

在学linux下的编程呢,不过还做过什么大的项目。哈哈。。要分析gcc的源码么?感觉有压力,但有时间的话我一定会去做的,可惜马上就要回校上课了
赵4老师 2012-07-20
  • 打赏
  • 举报
回复
比如gcc的源代码
赵4老师 2012-07-20
  • 打赏
  • 举报
回复
搜索下载一个C语言语法编译器开源项目的源代码,阅读并单步调试之。
ljhhh0123 2012-07-20
  • 打赏
  • 举报
回复
向楼主的钻研精神学习.
JXLFZ 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 的回复:]

确实没考虑函数的参数!
[/Quote]
嗯,那些参数都抛弃了。。
DataChat.Club 2012-07-20
  • 打赏
  • 举报
回复
确实没考虑函数的参数!
JXLFZ 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 的回复:]

首先,需要明确一点,在进行扫描的之前,需要做词素分析,也就是此法分析。书中所说的括号指的是“词素:符号: )”。而不是字符')'
while(this.type != ')')
上面这句话经过词法分析之后,得到的词素为:
"while" "(" "this" "." "type" "!=" "')'" ")"
这样你就能明白为什么没有匹配里面的')'了,因为词素"')'"并不是")"。
……
[/Quote]

好吧,我必须得承认我并不知道你说的词素分析。但我在这里想说的并不是while(this.type != ')')这个语句没有匹配好,而是想说作者的这个语句用在他的程序上是不对了,会产生错误,要是你不相信,你可以编译源码试一下
时间坐标 2012-07-20
  • 打赏
  • 举报
回复
首先,需要明确一点,在进行扫描的之前,需要做词素分析,也就是此法分析。书中所说的括号指的是“词素:符号: )”。而不是字符')'
while(this.type != ')')
上面这句话经过词法分析之后,得到的词素为:
"while" "(" "this" "." "type" "!=" "')'" ")"
这样你就能明白为什么没有匹配里面的')'了,因为词素"')'"并不是")"。

楼主需要明白的很重要一点就是,在任何的语法分析和语言分析之前,都必须进行词法分析。语义语法分析都在词素表上进行的,《C专家编程》之所以没介绍,是它假设你已经懂这些知识了,从而减少篇幅,把最精华的东西写出来。
zhanshen2891 2012-07-20
  • 打赏
  • 举报
回复
是挺可畏!
图灵狗 2012-07-20
  • 打赏
  • 举报
回复
楼主还是有两把刷子,这样的学习态度,令人感慨后生可畏!
JXLFZ 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 的回复:]

没有看过这本书,但是知道实际中的DFA远比上面那个复杂,估计是作者的一个疏忽,LZ可以在网上找找C语言的文法规则,有很详细的解释,做词法分析的时候有很多编程语言并没有手动实现,而是借助LEX,所以没必要较劲吧
[/Quote]
嗯,也不是在较劲。
lisency 2012-07-20
  • 打赏
  • 举报
回复
没有看过这本书,但是知道实际中的DFA远比上面那个复杂,估计是作者的一个疏忽,LZ可以在网上找找C语言的文法规则,有很详细的解释,做词法分析的时候有很多编程语言并没有手动实现,而是借助LEX,所以没必要较劲吧

69,371

社区成员

发帖
与我相关
我的任务
社区描述
C语言相关问题讨论
社区管理员
  • C语言
  • 花神庙码农
  • 架构师李肯
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧