基于Heritrix的信息获取系统的研究及实现
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 绪论 | 第9-17页 |
·研究的背景和意义 | 第9-11页 |
·国内外研究现状分析 | 第11-14页 |
·本文的主要工作及创新点 | 第14-15页 |
·本文的结构 | 第15-17页 |
第二章 相关技术综述及使用情况 | 第17-27页 |
·HERITRIX 开源项目 | 第17-20页 |
·HTMLPARSER 开源项目 | 第20-22页 |
·BERKELEY 数据库 | 第22-24页 |
·ICTCLAS 分词系统 | 第24-25页 |
·其他项目组件 | 第25-26页 |
·本章小结 | 第26-27页 |
第三章 信息获取系统需求分析 | 第27-40页 |
·项目的范围和目标 | 第27-30页 |
·系统用例分析 | 第30-37页 |
·相关概念说明 | 第37-38页 |
·系统领域模型 | 第38-39页 |
·本章小结 | 第39-40页 |
第四章 信息获取系统总体设计 | 第40-51页 |
·系统架构设计 | 第40-42页 |
·信息抓取模块设计 | 第42-45页 |
·信息抽取模块设计 | 第45-46页 |
·配置 XML 模板模块设计 | 第46-47页 |
·系统数据库设计 | 第47-49页 |
·本章小结 | 第49-51页 |
第五章 信息获取系统详细设计 | 第51-63页 |
·HERITRIX 的模块化设计方式 | 第51-55页 |
·信息抓取模块设计实现 | 第55-57页 |
·信息抽取模块设计实现 | 第57-61页 |
·XML 文件制作模块设计实现 | 第61-62页 |
·本章小结 | 第62-63页 |
第六章 系统部署及性能测试 | 第63-70页 |
·系统运行环境及参数设置 | 第63-64页 |
·系统运行情况及实验数据分析 | 第64-69页 |
·本章小结 | 第69-70页 |
第七章 总结和展望 | 第70-72页 |
·本文的研究内容和贡献 | 第70-71页 |
·进一步的研究与展望 | 第71-72页 |
参考文献 | 第72-75页 |
致谢 | 第75页 |