首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究及在机场信息检索中的应用

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-10页
   ·论文的研究背景第8-9页
     ·研究背景第8页
     ·选题意义第8-9页
   ·研究内容第9页
   ·论文组织结构第9-10页
第2章 相关技术综述第10-22页
   ·搜索引擎综述第10-11页
   ·垂直搜索引擎第11-12页
     ·垂直搜索引擎概述第11页
     ·垂直搜索引擎的关键技术第11-12页
   ·中文分词第12-15页
     ·概述第12-13页
     ·中文分词算法第13-15页
   ·Lucene第15-21页
     ·Lucene 构架第16-17页
     ·Lucene 索引第17-21页
     ·Lucene 分词第21页
     ·Lucene 的优势第21页
   ·本章小结第21-22页
第3章 机场垂直搜索引擎的设计与实现第22-40页
   ·Nutch 架构和工作原理第22页
   ·原型系统的设计与实现第22-26页
     ·修改站点属性配置文件第23页
     ·修改网址过滤规则文件第23页
     ·配置 Tomcat第23-24页
     ·中文分词第24-26页
   ·显示效果第26-30页
     ·首页的修改第26-28页
     ·搜索结果页的修改第28页
     ·分页显示第28页
     ·改变摘要长度第28-30页
   ·检索结果聚类第30-31页
   ·网站资源的选取第31页
   ·如何限制 Nutch 爬虫的网页抓取范围第31-32页
   ·从 HTML 网页中提取正文信息第32-34页
     ·含有正文信息的标签节点的特征第32-33页
     ·含有噪声信息的标签节点的特征第33-34页
   ·从非 HTML 文件中提取文本第34-35页
     ·从 PDF 文件里提取文本信息第34-35页
     ·从 Word 文件里提取文本信息第35页
     ·从 Excel 文件里提取文本信息第35页
   ·相关搜索功能第35-36页
     ·依据字面相似度提供相关搜索功能第35-36页
     ·依据语义相关度提供相关搜索功能第36页
   ·文档相关性及排序第36-38页
   ·本章小结第38-40页
第4章 系统运行与测试第40-46页
   ·实验环境第40页
   ·系统测试策略第40-44页
     ·抓取器的测试第40-41页
     ·索引器测试第41-42页
     ·搜索器测试第42页
     ·对系统精确度和召回率的测试第42-44页
     ·对两种聚类算法的测试第44页
   ·系统综合性能分析第44-45页
   ·本章小结第45-46页
结论第46-48页
参考文献第48-52页
致谢第52-54页
攻读硕士学位期间所发表的论文第54-56页
个人简历第56页

论文共56页,点击 下载论文
上一篇:衡水学院分院开放性实验管理系统的设计与实现
下一篇:职业院校实习与毕业环节管理系统的开发