WEB主题信息采集系统的设计与实现
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第一章 绪论 | 第9-17页 |
| ·课题的研究背景 | 第9-10页 |
| ·国内外研究技术现状 | 第10-15页 |
| ·信息抽取主要技术工具的比较 | 第10-11页 |
| ·WEB 信息抽取算法研究 | 第11-15页 |
| ·WEB 文本挖掘 | 第15页 |
| ·本系统的设计目标及意义 | 第15页 |
| ·本论文的主要工作 | 第15-16页 |
| ·本论文的组织结构 | 第16-17页 |
| 第二章 系统需求分析 | 第17-31页 |
| ·网页特征分析 | 第17-24页 |
| ·网络数据信息内容分析 | 第17页 |
| ·数据信息特征的分析 | 第17-20页 |
| ·网页结构分析 | 第20-24页 |
| ·功能性需求 | 第24-26页 |
| ·非功能性需求 | 第26页 |
| ·关键技术点 | 第26-30页 |
| ·算法的选择 | 第26-27页 |
| ·网页去重研究 | 第27-30页 |
| ·小结 | 第30-31页 |
| 第三章 系统构架设计 | 第31-36页 |
| ·系统设计目标 | 第31页 |
| ·系统概要设计 | 第31-35页 |
| ·0020 系统总体技术路线 | 第31-32页 |
| ·0020 开发语言与开发环境 | 第32-34页 |
| ·系统的架构设计 | 第34-35页 |
| ·本章小结 | 第35-36页 |
| 第四章 系统的详细设计 | 第36-47页 |
| ·信息资料的定制 | 第36-41页 |
| ·数据提取程序 | 第41-43页 |
| ·管理系统 | 第43-46页 |
| ·本章小结 | 第46-47页 |
| 第五章 系统运行及试验结果 | 第47-55页 |
| ·系统运行 | 第47-51页 |
| ·系统界面介绍 | 第47页 |
| ·系统功能介绍 | 第47-51页 |
| ·测试 | 第51-53页 |
| ·单元测试 | 第51-52页 |
| ·功能测试 | 第52-53页 |
| ·应用评估 | 第53-54页 |
| ·小结 | 第54-55页 |
| 第六章 总结与展望 | 第55-57页 |
| ·工作总结 | 第55页 |
| ·展望 | 第55-57页 |
| 致谢 | 第57-58页 |
| 参考文献 | 第58-62页 |
| 附件 | 第62-75页 |
| 附件1 匹配规则的代码设计 | 第62-66页 |
| 附件2 分析列表页内容的代码设计 | 第66-68页 |
| 附件3 获取内容页的代码设计 | 第68-69页 |
| 附件4 匹配规则,精确入库 | 第69-75页 |