词法分析

 

 

一.词法分析程序的功能。

    词法分析程序完成的事编译第一阶段的工作。词法分析工作可以使独立的一遍,把字符流的源程序变成单词序列,输出到一个中间文件,这个文件作为语法分析程序的恶输入而继续的编译过程。对字符串表示的源程序从左到右进行扫描和分解根据词法规则,识别出一个一个具有独立意义的单词符号以供语法分析之用。发现词法错误则返回出错信息。

二。符号与种别码的对照表以及源程序。

      我所做的词法分析程序和大多数程序差不多,也有着很多的不足,我将需要进行翻译的各种单词符号的对应的种别码分成了若干个数组,并且在后期的修改中将老师的种别表进行了扩充,具体的功能是:输入需要翻译的东西作为字符串存储在A[][]的数组中,用字符ch来存储一个个的字符,在一次的循环中翻译出一个个种别类并将其用(,)来显示出来,一次循环,用数组TOKEN[]存储,进行下一次循环的同时清除里面的数据,方便进行下一次的翻译与存储。大致是如此。

     源代码如下:

#include<stdio.h>

#include<string.h>

#include<iostream.h>

char prog[80],token[8];

char ch;

int syn,p,m=0,n,row,sum=0;

char *rwtab[6]={"begin","if","then","while","do","end"};

void scaner()

{

    /*

        共分为三大块,分别是标示符、数字、符号,对应下面的 if   else if  和 else

       

   

    */

    for(n=0;n<8;n++) token[n]=NULL;

    ch=prog[p++];

    while(ch==' ')

    {

        ch=prog[p];

        p++;

    }

    if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))  //可能是标示符或者变量名

    {

        m=0;

        while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))

        {

            token[m++]=ch;

            ch=prog[p++];

        }

        token[m++]='';

        p--;

        syn=10;

        for(n=0;n<6;n++)  //将识别出来的字符和已定义的标示符作比较,

            if(strcmp(token,rwtab[n])==0)

            {

                syn=n+1;

                break;

            }

    }

    else if((ch>='0'&&ch<='9'))  //数字

    {

        {

            sum=0;

            while((ch>='0'&&ch<='9'))

            {

                sum=sum*10+ch-'0';

                ch=prog[p++];

            }

        }

        p--;

        syn=11;

        if(sum>32767)

            syn=-1;

    }

    else switch(ch)   //其他字符

    {

        case'<':m=0;token[m++]=ch;

            ch=prog[p++];

            if(ch=='>')

            {

                syn=21;

                token[m++]=ch;

            }

            else if(ch=='=')

            {

                syn=22;

                token[m++]=ch;

            }

            else

            {

                syn=23;

                p--;

            }

            break;

        case'>':m=0;token[m++]=ch;

            ch=prog[p++];

            if(ch=='=')

            {

                syn=24;

                token[m++]=ch;

            }

            else

            {

                syn=20;

                p--;

            }

            break;

        case':':m=0;token[m++]=ch;

            ch=prog[p++];

            if(ch=='=')

            {

                syn=18;

                token[m++]=ch;

            }

            else

            {

                syn=17;

                p--;

            }

            break;

        case'*':syn=13;token[0]=ch;break;

        case'/':syn=14;token[0]=ch;break;

        case'+':syn=15;token[0]=ch;break;

        case'-':syn=16;token[0]=ch;break;

        case'=':syn=25;token[0]=ch;break;

        case';':syn=26;token[0]=ch;break;

        case'(':syn=27;token[0]=ch;break;

        case')':syn=28;token[0]=ch;break;

        case'#':syn=0;token[0]=ch;break;

        case' ':syn=-2;break;

        default: syn=-1;break;

    }

}

int main()

{

    p=0;

    row=1;

    cout<<"Please input string:"<<endl;

    do

    {

        cin.get(ch);

        prog[p++]=ch;

    }

    while(ch!='#');

    p=0;

    do

    {

        scaner();

        switch(syn)

        {

        case 11: cout<<"("<<syn<<","<<sum<<")"<<endl; break; 

        case -1: cout<<"Error in row "<<row<<"!"<<endl; break;

        case -2: row=row++;break;

        default: cout<<"("<<syn<<","<<token<<")"<<endl;break;

        }

    }

    while (syn!=0);

}

原文地址:https://www.cnblogs.com/zhu573514187/p/6030345.html