摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第8-12页 |
1.1 研究背景 | 第8-9页 |
1.1.1 回溯自动机 | 第8-9页 |
1.1.2 XML 解析器 | 第9页 |
1.2 研究现状 | 第9-10页 |
1.2.1 回溯自动机 | 第9页 |
1.2.2 XML 解析器 | 第9-10页 |
1.3 主要研究内容及目的 | 第10-11页 |
1.4 论文章节安排 | 第11-12页 |
第二章 相关理论与技术 | 第12-28页 |
2.1 形式语言与自动机相关理论介绍 | 第12-19页 |
2.1.1 形式语言基本理论介绍 | 第12-14页 |
2.1.2 自动机基本理论介绍 | 第14-18页 |
2.1.2.1 有限自动机(Finite Automata, FA) | 第14-16页 |
2.1.2.2 下推自动机(Pushdown Automata, PDA) | 第16-18页 |
2.1.3 自动机与形式语言之间的关系 | 第18-19页 |
2.2 回溯自动机相关概念 | 第19-21页 |
2.2.1 回溯自动机的形式化定义及模型 | 第20-21页 |
2.2.2 回溯自动机接受的语言 | 第21页 |
2.2.3 多步回溯自动机 | 第21页 |
2.2.4 回溯自动机的状态转换图 | 第21页 |
2.3 XML 解析器极其解析方式 | 第21-26页 |
2.3.1 XML 的应用及其规范 | 第21-23页 |
2.3.2 XML 解析器及其解析方式 | 第23-26页 |
2.4 本章小结 | 第26-28页 |
第三章 扩展的回溯自动机的定义及文法 | 第28-44页 |
3.1 回溯自动机的文法 | 第28-31页 |
3.1.1 求解同回溯自动机等价文法的基本思想 | 第28-29页 |
3.1.2 同回溯自动机等价的文法 | 第29-31页 |
3.2 扩展的确定回溯自动机(EDTA) | 第31-35页 |
3.2.1 EDTA 的形式定义 | 第31-33页 |
3.2.2 同 EDTA 等价的文法 | 第33-35页 |
3.3 扩展的确定多步回溯自动机(EDMTA) | 第35-37页 |
3.3.1 EDMTA 的形式定义 | 第35-36页 |
3.3.2 同 EDMTA 等价的文法 | 第36-37页 |
3.4 扩展的非确定回溯自动机(ENTA) | 第37-40页 |
3.4.1 ENTA 的定义 | 第37-38页 |
3.4.2 ENTA 的文法 | 第38-40页 |
3.5 扩展的非确定多步回溯自动机(ENMTA) | 第40-42页 |
3.5.1 ENMTA 的定义 | 第40页 |
3.5.2 ENMTA 的文法 | 第40-42页 |
3.6 本章小结 | 第42-44页 |
第四章 基于扩展的回溯自动机的 XML 解析器 | 第44-62页 |
4.1 JSAX 解析器的结构 | 第44-45页 |
4.1.1 词法分析器 | 第44-45页 |
4.1.2 语法分析器 | 第45页 |
4.1.3 事件处理器 | 第45页 |
4.2 JSAX 解析器的设计与实现 | 第45-59页 |
4.2.1 词法分析器的设计与实现 | 第45-52页 |
4.2.1.1 词法分析器的设计 | 第45-46页 |
4.2.1.2 词法分析器的实现 | 第46-52页 |
4.2.2 语法分析器的设计与实现 | 第52-56页 |
4.2.2.1 语法分析器的设计 | 第52-55页 |
4.2.2.2 语法分析器的实现 | 第55-56页 |
4.2.3 事件处理器(MyHandler)回调 | 第56-58页 |
4.2.4 良构性约束的实现 | 第58-59页 |
4.3 性能优化 | 第59-61页 |
4.3.1 使用哈希表,提高查找引用的速度 | 第59页 |
4.3.2 使用字符查找表进行字符判断 | 第59-60页 |
4.3.3 基于统计对自动机进行优化 | 第60-61页 |
4.4 本章小结 | 第61-62页 |
第五章 实验结果分析及比较 | 第62-72页 |
5.1 功能测试 | 第62-69页 |
5.1.1 对符合 WFC 的 XML 文档的测试 | 第62-64页 |
5.1.2 对不符合 WFC 的 XML 文档的测试 | 第64-69页 |
5.2 性能测试 | 第69-72页 |
第六章 总结与展望 | 第72-74页 |
6.1 工作总结 | 第72页 |
6.2 下一步工作 | 第72-74页 |
致谢 | 第74-76页 |
参考文献 | 第76-79页 |