现代维吾尔语信息检索与管理平台

摘要	第5-7页
ABSTRACT	第7-8页
第1章绪论	第11-17页
1.1 课题的研究背景和意义	第11-12页
1.2 国内外研究现状	第12-15页
1.3 论文的主要研究内容和组织结构	第15-17页
第2章系统总体方案设计	第17-28页
2.1 系统设计目标	第17页
2.2 系统功能列表	第17-18页
2.2.1 搜索引擎用户搜索界面	第17页
2.2.2 搜索引擎后台管理界面	第17-18页
2.3 系统组成结构	第18-19页
2.4 系统数据流图	第19-22页
2.4.1 爬取网页建立索引的数据流	第19-20页
2.4.2 搜索页面提交搜索关键词搜索的数据流	第20页
2.4.3 点击搜索结果页面数据流	第20-22页
2.5 系统的高并发高可用架构设计	第22-27页
2.5.1 系统软件架构	第22-23页
2.5.2 技术方案	第23-25页
2.5.3 基于Mycat实现网页数据的拆分	第25-26页
2.5.4 Redis集群	第26-27页
2.6 本章小结	第27-28页
第3章搜索引擎子系统实现	第28-43页
3.1 基于Hadoop分布式系统的Nutch爬虫	第28-32页
3.1.1 Hadoop分布式框架	第28-29页
3.1.2 Nutch爬虫介绍和环境搭建	第29-31页
3.1.3 网页数据的存储	第31-32页
3.1.4 网页编码分析	第32页
3.2 分词模型与分词标注对外服务发布	第32-35页
3.2.1 维吾尔语分词模型介绍	第32-34页
3.2.2 基于WebService发布分词标记服务	第34-35页
3.3 网页结构内容分析与过滤	第35-36页
3.4 Lucene索引器	第36-37页
3.5 检索器	第37-42页
3.5.1 搜索结果的排序与高亮显示	第37-41页
3.5.2 网页快照	第41-42页
3.6 本章小结	第42-43页
第4章后台管理子系统实现	第43-49页
4.1 Nutch的启动与参数配置	第43-44页
4.2 爬虫运行状态的监控	第44-46页
4.3 分词实验管理	第46页
4.4 用户行为管理	第46-48页
4.5 本章小结	第48-49页
第5章系统测试	第49-65页
5.1 搜索引擎子系统的测试	第49-58页
5.1.1 系统的功能测试	第49-56页
5.1.2 系统的性能测试	第56-58页
5.2 后台管理子系统的测试	第58-62页
5.3 系统测试结果分析	第62-64页
5.4 本章小结	第64-65页
第6章总结与展望	第65-67页
6.1 总结	第65-66页
6.2 展望	第66-67页
参考文献	第67-69页
致谢	第69页