摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
第一章 绪论 | 第8-16页 |
·Web挖掘概述 | 第8-10页 |
·Web挖掘的定义 | 第8页 |
·Web挖掘的分类 | 第8-10页 |
·Web信息抽取 | 第10-13页 |
·Web信息抽取的定义 | 第10页 |
·Web信息抽取的意义 | 第10-11页 |
·Web信息抽取技术的研究进展 | 第11-13页 |
·本课题研究的目的和意义 | 第13-14页 |
·本文研究的内容和组织结构 | 第14-15页 |
·本章小结 | 第15-16页 |
第二章 相关技术研究 | 第16-27页 |
·HTML页面构成分析 | 第16-17页 |
·新闻网页的特征和结构分析 | 第17-19页 |
·Web信息抽取中的数据定位 | 第19-21页 |
·正则表达式的介绍 | 第21-26页 |
·正则表达式简介 | 第21页 |
·正则表达式的基本语法 | 第21-23页 |
·利用正则表达式处理解析匹配 | 第23-26页 |
·本章小结 | 第26-27页 |
第三章 抽取规则的构造与实现 | 第27-35页 |
·基于人工的规则构造 | 第27-29页 |
·基于正则表达式调试器的规则构造 | 第29-34页 |
·本章小结 | 第34-35页 |
第四章 新闻信息抽取系统(WebNE)的设计与实现 | 第35-55页 |
·系统目标分析 | 第35-36页 |
·系统开发环境的选择 | 第36-38页 |
·操作系统平台选择 | 第36页 |
·Web服务器与数据库软件的选择 | 第36-37页 |
·编程语言的选择 | 第37-38页 |
·系统的组成 | 第38-39页 |
·系统的实现过程 | 第39-46页 |
·信息源定制阶段 | 第39页 |
·信息抽取阶段 | 第39-42页 |
·信息管理阶段 | 第42-46页 |
·系统定时任务的实现 | 第46-47页 |
·用户使用前端页面实现 | 第47-54页 |
·页面的组成和层次结构 | 第47-48页 |
·JSP页面 | 第48-54页 |
·本章小结 | 第54-55页 |
第五章 系统测试和结论 | 第55-58页 |
第六章 总结与展望 | 第58-60页 |
·论文的总结 | 第58-59页 |
·进一步的研究工作 | 第59-60页 |
参考文献 | 第60-64页 |
致谢 | 第64页 |