首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于P2PKM的桌面搜索优化的研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-12页
   ·研究基础第9-10页
   ·研究内容第10-11页
   ·本文组织第11-12页
第二章 相关技术研究现状第12-18页
   ·桌面搜索引擎研究现状第12-15页
     ·概述第12-13页
     ·Lucene搜索引擎第13-15页
   ·近似镜像网页检测算法的研究现状第15-17页
     ·基于全文分段签名的近似镜像网页检测算法第15-16页
     ·基于关键词匹配的近似镜像算法第16-17页
   ·本章小结第17-18页
第三章 基于P2PKM的桌面搜索引擎第18-38页
   ·引言第18-20页
   ·基于P2PKM的桌面搜索引擎第20-28页
     ·本地知识库的组织结构第20-22页
       ·知识库的两级分类结构设计第20-21页
       ·知识库两级分类之间映射关系的存储第21-22页
     ·索引模块结构第22-27页
       ·索引创建的算法第23-25页
       ·单个知识包索引创建算法第25-27页
     ·搜索模块结构第27-28页
       ·搜索的算法第27页
       ·知识库搜索算法第27-28页
   ·Lucene搜索引擎开源包分析第28-37页
     ·Lucene搜索引擎系统结构第28-31页
     ·Lucene索引和搜索设计第31-34页
     ·Lucene检索关键类的UML类图分析第34-37页
       ·索引管理包第34-36页
       ·查询分析包和检索包第36-37页
   ·本章小结第37-38页
第四章 中文分词技术的优化第38-45页
   ·Lucene对中文的支持第38-40页
   ·中文分词技术及其分类第40-41页
   ·正向最大匹配算法描述第41页
   ·词表描述第41-42页
   ·正向最大匹配算法的应用第42-44页
   ·本章小结第44-45页
第五章 PDF、WORD和EXCEL文档检索扩展第45-59页
   ·Lucene搜索引擎索引文件概念组成第45-49页
     ·段(Segment)第45页
     ·文档(Document)第45-46页
     ·域(Field)第46页
     ·项fTerm)第46-47页
     ·文档结构包org.apache.lucene.document的UML类图分析第47-48页
     ·小结第48-49页
   ·使用PDFBox处理PDF文档第49-53页
   ·使用POI处理WORD文档和EXCEL文档第53-58页
   ·本章小结第58-59页
第六章 近似镜像检测算法的应用第59-65页
   ·信息提取和元数据提取第59-60页
     ·信息提取第59-60页
     ·元数据提取第60页
   ·对重复文本的定义第60-61页
   ·近似镜像文本检测算法第61-62页
     ·算法描述第61-62页
     ·性能分析第62页
   ·为本系统定制一个消重方法第62-64页
   ·本章小结第64-65页
第七章 总结与展望第65-66页
   ·本文工作总结第65页
   ·下一步的工作及展望第65-66页
参考文献第66-70页
致谢第70-71页
在读期间参加的科研项目第71-72页
在读期间发表录用的学术论文第72页

论文共72页,点击 下载论文
上一篇:不同证型原发性肝癌患者GGT、AMY糖链变化及机理研究
下一篇:基于FPGA的数字合成信号发生器