摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
第一章 绪论 | 第7-9页 |
·引言 | 第7-8页 |
·本文主要内容和工作 | 第8-9页 |
第二章 相关通用类 | 第9-20页 |
·分布式框架(HADOOP) | 第9-11页 |
·索引工具(LUCENE) | 第11-12页 |
·网络工具(HTTPCLIENT) | 第12-14页 |
·特性 | 第12-13页 |
·编程概念 | 第13-14页 |
·HTML分析器(HTMLPARSER) | 第14-15页 |
·测试工具(JUNIT) | 第15-16页 |
·特性 | 第15-16页 |
·框架组成 | 第16页 |
·XML解析器(DOM4J) | 第16-17页 |
·日志记录(LOG4J) | 第17-19页 |
·小结 | 第19-20页 |
第三章 HADOOP分布式编程框架原理 | 第20-27页 |
·MAP/REDUCE | 第20-22页 |
·HADOOP的运行机制 | 第22-26页 |
·小结 | 第26-27页 |
第四章 KM分布式系统框架设计 | 第27-59页 |
·系统设计 | 第27-29页 |
·模块分析及实现原理 | 第29-52页 |
·信息抓取模块 | 第29-38页 |
·索引模块 | 第38-45页 |
·搜索模块 | 第45-47页 |
·插件管理 | 第47-48页 |
·配置模块 | 第48-52页 |
·详细设计 | 第52-56页 |
·初始化(Starter) | 第52-53页 |
·链接准备器(Linker) | 第53页 |
·信息获取模块(Fetcher) | 第53页 |
·链接分析模块(Analyzer) | 第53-54页 |
·任务搜集模块(Collector) | 第54页 |
·索引生成模块(Indexer) | 第54页 |
·搜索模块(Searcher) | 第54-55页 |
·配置模块类(Configer) | 第55-56页 |
·分布式运行器(Distribute Runner) | 第56页 |
·工具类(Utils) | 第56页 |
·测试驱动开发 | 第56-58页 |
·小结 | 第58-59页 |
第五章 分布式运行 | 第59-64页 |
·运行配置 | 第59-60页 |
·运行结果 | 第60-63页 |
·小结 | 第63-64页 |
结束语 | 第64-65页 |
参考文献 | 第65-67页 |
攻读硕士学位期间发表的论文 | 第67-68页 |
致谢 | 第68-69页 |