Web信息提取技术研究
第一章 绪论 | 第1-10页 |
1.1 信息提取与席卷全球的XML技术 | 第7-8页 |
1.2 组件对象模型(COM) | 第8页 |
1.3 与ASP的结合 | 第8-9页 |
1.4 研究内容 | 第9-10页 |
第二章 XML及相关技术 | 第10-15页 |
2.1 什么是XML | 第10-12页 |
2.1.1 XML的产生 | 第10页 |
2.1.2 XML是元标记语言 | 第10页 |
2.1.3 XML的特点 | 第10-11页 |
2.1.4 XML与HTML的比较 | 第11-12页 |
2.2 XML包含的要素 | 第12-13页 |
2.2.1 文档类型定义(DTD) | 第12-13页 |
2.2.2 XML Schema简介 | 第13页 |
2.2.3 可扩展样式语言(XSL) | 第13页 |
2.3 XML数据存取技术 | 第13-15页 |
第三章 组件对象模型COM | 第15-31页 |
3.1 COM的思想 | 第15-16页 |
3.2 COM对象 | 第16-20页 |
3.2.1 接口 | 第17-18页 |
3.2.2 基本的IUnknown接口 | 第18-19页 |
3.2.3 Vtables | 第19-20页 |
3.2.4 COM中组件、对象和接口的关系 | 第20页 |
3.3 COM的客户/服务器模型 | 第20-25页 |
3.3.1 COM服务器 | 第20-22页 |
3.3.2 COM客户 | 第22-23页 |
3.3.3 客户/服务器实现 | 第23-25页 |
3.4 COM应用程序的构成 | 第25页 |
3.5 COM对象的重用 | 第25-26页 |
3.6 基于COM的组件化程序设计方法 | 第26-29页 |
3.6.1 面向对象程序设计方法 | 第26-27页 |
3.6.2 基于COM的组件化程序设计方法 | 第27-29页 |
3.7 其它组件服务 | 第29页 |
3.8 COM技术的未来 | 第29-31页 |
第四章 Active Server Pages | 第31-35页 |
4.1 ASP简介 | 第31页 |
4.2 ASP的工作原理 | 第31-32页 |
4.3 ASP主要技术特点 | 第32-33页 |
4.4 ASP与其他技术的比较 | 第33-35页 |
4.4.1 CGI | 第33页 |
4.4.2 ISAPI | 第33-34页 |
4.4.3 ASP的优势 | 第34-35页 |
第五章 系统设计与实现 | 第35-56页 |
5.1 XML文档分析 | 第35-41页 |
5.1.1 对XML文档的访问机制 | 第35-37页 |
5.1.2 系统分析的目标 | 第37页 |
5.1.3 XML数据文档分析 | 第37-39页 |
5.1.3 XML和数据库 | 第39-41页 |
5.2 COM的设计与实现 | 第41-51页 |
5.2.1 查询的分类 | 第41页 |
5.2.2 COM的设计 | 第41-43页 |
5.2.3 COM的实现 | 第43-49页 |
5.2.4 活动模版库(ATL) | 第49-51页 |
5.2.5 COM的调试与功能检验 | 第51页 |
5.3 XML文档分析查询器的设计与实现 | 第51-56页 |
5.3.1 查询分析器的设计 | 第52-53页 |
5.3.2 查询分析器的实现 | 第53-54页 |
5.3.3 查询分析器的开发、运行环境和功能简介 | 第54-56页 |
第六章 系统的分析 | 第56-64页 |
6.1 系统的查询效率 | 第56-59页 |
6.1.1 影响XML查询效率的因素 | 第56-57页 |
6.1.2 算法与效率分析 | 第57-59页 |
6.2 系统的特点 | 第59-62页 |
6.2.1 与XML Spy的比较 | 第59页 |
6.2.2 与XSL的比较 | 第59-61页 |
6.2.3 与XQL的比较 | 第61页 |
6.2.4 与直接使用微软COM的比较 | 第61-62页 |
6.3 定制COM的特性探讨 | 第62-64页 |
结束语 | 第64-65页 |
致 谢 | 第65-66页 |
参考文献 | 第66-67页 |