WEB主题信息采集系统的设计与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-17页 |
·课题的研究背景 | 第9-10页 |
·国内外研究技术现状 | 第10-15页 |
·信息抽取主要技术工具的比较 | 第10-11页 |
·WEB 信息抽取算法研究 | 第11-15页 |
·WEB 文本挖掘 | 第15页 |
·本系统的设计目标及意义 | 第15页 |
·本论文的主要工作 | 第15-16页 |
·本论文的组织结构 | 第16-17页 |
第二章 系统需求分析 | 第17-31页 |
·网页特征分析 | 第17-24页 |
·网络数据信息内容分析 | 第17页 |
·数据信息特征的分析 | 第17-20页 |
·网页结构分析 | 第20-24页 |
·功能性需求 | 第24-26页 |
·非功能性需求 | 第26页 |
·关键技术点 | 第26-30页 |
·算法的选择 | 第26-27页 |
·网页去重研究 | 第27-30页 |
·小结 | 第30-31页 |
第三章 系统构架设计 | 第31-36页 |
·系统设计目标 | 第31页 |
·系统概要设计 | 第31-35页 |
·0020 系统总体技术路线 | 第31-32页 |
·0020 开发语言与开发环境 | 第32-34页 |
·系统的架构设计 | 第34-35页 |
·本章小结 | 第35-36页 |
第四章 系统的详细设计 | 第36-47页 |
·信息资料的定制 | 第36-41页 |
·数据提取程序 | 第41-43页 |
·管理系统 | 第43-46页 |
·本章小结 | 第46-47页 |
第五章 系统运行及试验结果 | 第47-55页 |
·系统运行 | 第47-51页 |
·系统界面介绍 | 第47页 |
·系统功能介绍 | 第47-51页 |
·测试 | 第51-53页 |
·单元测试 | 第51-52页 |
·功能测试 | 第52-53页 |
·应用评估 | 第53-54页 |
·小结 | 第54-55页 |
第六章 总结与展望 | 第55-57页 |
·工作总结 | 第55页 |
·展望 | 第55-57页 |
致谢 | 第57-58页 |
参考文献 | 第58-62页 |
附件 | 第62-75页 |
附件1 匹配规则的代码设计 | 第62-66页 |
附件2 分析列表页内容的代码设计 | 第66-68页 |
附件3 获取内容页的代码设计 | 第68-69页 |
附件4 匹配规则,精确入库 | 第69-75页 |