编译原理LL(1)语法分析的可视化教学方法

2015-12-27王涛

新教育时代电子杂志(教师版) 2015年6期

关键词：文法原理可视化

王涛

（滁州学院安徽滁州 239000）

编译原理LL(1)语法分析的可视化教学方法

王涛

（滁州学院安徽滁州 239000）

编译原理是公认的难教难学的课程之一，其主要原因是编译原理要求的知识体系复杂，并且算法抽象。本文的作者针对编译原理课程的特征提出了一种教学观点，即重视对学生的概念教学和形象教学。为了说明形象教学在编译原理教学中的重要性，在本文以LL(1)语法分析为例提出了一种编译原理可视化软件的设计方法，并给了软件实例。教学实践证明，由于可视化教学为学生提供了直观的感性材料，极大的提高了学生理解相关概念并掌握相关算法的能力。

思维模式 LL(1)算法可视化

编译原理在计算机科学中的地位非常重要，编译原理知识掌握较好的学生在从事编程工作时，往往都具有较好的编程语言运用能力和对新语言的学习能力。在ACM/IEEE-CS发布的CSC2013（Computer Science Curricula 2013）中将编译原理相关的知识体系列入到Programming Language知识体系的核心课程中[1]。

在实际的教学过程中，由于编译原理与汇编语言、计算机组成原理、数据结构、操作系统、高级编程语言等课程的关系紧密，同时对可计算理论、形式语言与自动机等知识有要求，知识体系复杂，是公认的难学、难教的课程[2][3]，探索编译原理如何成功教学的方法一直是该课程教学研究的热点问题。

本文作者结合编译原理的教学特点，提出了一种新的课程教授思路，要点是：一、重视学生的系统思维、逻辑思维和形象思维的锻炼，让学生掌握学好编译原理的方法；二、通过设计并实现一套编译方法教学软件，提供直接、形象的感性材料，在解决较复杂的算法问题的时候，有助于学生思维的顺利进行。

1.掌握大学生的思维规律是教好编译方法的关键

编译原理的课时设置相对于其知识体系来讲一般偏少，以滁州学院计算机科技与技术专业中对编译原理的课程设置来看，其理论课时只有48个学时、实验课时只有16个课时，其它高校的在课时的设置上会有所差异，但最多也只相差10几个课时上下。在如此短的课时中如何让学生实现编译方法课的入门是一个挑战。

第一，在教学中首先要重视概念的教学，思维过程是分析、综合、比较、抽象、概括、判断和推理的过程，首先要形成概念，然后才能判断和推理，使学生真正的理解相关的定理、定义。

因此，在讲授类似的概念时要重点让学生掌握译方法的系统思维、逻辑思维。

第二，要重视形象教学。思维是在感性材料的基础上产生的，感性认识是思维活动的源泉和根据。在编译原理授课时，如果脱离具体形象，特别是在解决比较复杂的问题的时候，由于无法提供直观的鲜明、生动的示例，会妨碍思维的顺利进行。因此，在课程中针对典型的算法要设计要实现一系列可视化的算法程序，让学生亲自参与到算法编写，并通过可视化的手段实现诸如NFA到DFA的转化算法，词法分析相关算法，语法分析的相关算法，语义分析相关算法，目标代码生成相关算法等，通过动画形式让学生理解算法的内涵。

在本文的其余部分，将以LL(1)算法为例说明如何设计编译原理可视化教学模块。

2.LL(1)算法可视化模块的设计

2.1 LL(1)中相关概念的逻辑关系

LL(1)是实现语法分析器的经典算法之一，其本质是按文法的产生式，识别输入符号串是否为一个合法的子句，LL(1)中的第一个L表示从左到右扫描输入串，第二个L表示最左推导,1表示分析时每一步只需向前查看一个符号。目前已经有基于JAVA语言的编译原理可视化软件的报导，考虑到C#语言强大的界面处理功能，本文中的模块基于C#语言设计并开发。

LL(1)的生成过程是一种自上而下的生成树的过程，所谓的与输入串的匹配，即自左向右依次对比生成树的叶子结点与输入串的每一个符号是否吻合，否则，输入串不合法。在进行该算法模块设计的时候要通过可视化算法重点向学生讲授以下内容，

⑴要消除递归性。文法的生成式是有递归性的，如果利用计算机直接实现一个文法结构会存在若干问题，主要表现在可能会存在左递归，使得编译程序陷入死循环。

⑵要消除“回溯”。由于产生式左部会对应多个候选式，编译程序如果无法选择正确的候选式，会让编译程序不停的“回溯”，依次尝试直到找到一个合适的候选式。

⑶消除空符号ε带来的影响。当一个输入符号遇到一个非终结符时，可能会产生ε，如何判断此时为错误、无法进行或者可以继续分析是自上而下分析的另一要注意的内容。

⑷一个文法只有在消除了以上的影响之后，才可以称为LL(1)文法，在此时要向学生讲授LL(1)的详细定义，概念的内涵和外延，并指出，成为了LL(1)文法才使得自上而下语法分析编译算法的编程成为可能。

2.2.模块的设计要点

一般来讲，实现LL(1)算法有两种方法，一种是递归下降分析程序，一种是预测分析程序，本文所述的模块设计采用的是预测分析程序。

（1）可视化算法解决方案的目录结构。编译原理可视化软件采用C#语言和Visio 2010开发完成，在解决方案中添加两个主要项目，分别为ComilerPrinciples和CompilerDLL，前者用于控制算法界面的可视化逻辑，是界面层，后者用于完成算法的处理，是控制逻辑层。两者之间通过函数调用实现交互。

⑵LL(1)可视化算法模块的核心类文件。在LL(1)可视化算法模块中的界面层中的核心类文件是DlgForcastAnalysisTable.cs和LL1_Analysis. cs，分别用于预测分析表和LL(1)算法的可视化。在控制逻辑层中的核心类文件是LL1_Analysis.cs和Model_LL1_StepStatus.cs，分别用于完成LL(1)预测算法的控制逻辑以及分步骤呈现算法的实现过程。

⑶模块的复用。在进行软件设计的时候，尽量的考虑到控制逻辑与界面层的组件复用，例如在LL(1)分析模块中，会复用到词法分析的所有功能，因此通过继承关系和组件化调用尽量的复用现有模块，从而提高编程的效率。

3.基于C#的LL(1)算法可视化模块实例

为了更好说明LL(1)可视化算法的运行过程，以表达式“为例进行分析说明。

3.1.词法分析

如图1所示，首先启动编译原理可视化算法软件，在菜单中调用LL (1)分析模块。在进行语法分析前先完成词法分析，将表达式中的每一个单词符号解析出来，这一步是后续分析的基础，并且词法分析的结果将作为语法分析的输入使用。

图1：词法分析界面示意图

通过此功能可以向学生讲授目前常用的编程环境IDE的工作原理，IDE的核心功能是按所支持的编程言语的格式完成代码的编写。在不考虑编译器的情况下，IDE和普通的文本编译工具是没有区别的，正是由于存在了编译器模块才使得IDE可以将我们输入的文本字符串转换为编译器可以识别的单词符号串。有了这样的认识，首先可以让学生破除对编译原理的神秘感，其次通过亲自动手可以让学生直观的理解符号串的生成以及后续的语法分析的关系[8]。

词法分析器所基于的算法是基于DFA的单词符号识别算法，单词识别完成后的输出结果如表1所示。