首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于企业深度挖掘型垂直搜索引擎的研究与应用

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-17页
   ·研究背景、意义第10-11页
   ·垂直搜索引擎的服务市场第11-14页
     ·搜索引擎服务市场背景第11-13页
     ·企业搜索引擎服务市场趋势第13-14页
   ·本文研究内容第14-15页
   ·本文组织结构第15-17页
第二章 垂直搜索引擎研究第17-21页
   ·垂直搜索引擎的概述第17页
   ·垂直搜索引擎结构及工作原理第17-19页
   ·垂直搜索引擎的优势第19页
   ·构建良好深度挖掘型垂直搜索引擎的要求第19-20页
   ·本章小结第20-21页
第三章 面向主题的数据采集第21-30页
   ·网络主题爬虫概述第21-26页
     ·网络主题爬虫定义第21-22页
     ·网络主题爬虫搜索策略第22-24页
     ·主题爬虫网页的搜集第24-26页
   ·主题相关性算法及改进第26-27页
     ·偏好主题 PageRank 算法第26-27页
   ·元数据管理模块第27-29页
     ·元数据管理第27-29页
   ·本章小结第29-30页
第四章 数据的压缩索引和 HBase 云存储第30-42页
   ·数据的压缩第30-34页
     ·范式哈夫曼算法第30-34页
   ·压缩索引的方法第34-36页
     ·倒排文件压缩算法第34-36页
   ·HBase 云存储第36-41页
     ·引言第36-37页
     ·文件存储系统 HDFS第37-39页
     ·海量数据处理 MapReduce第39-41页
     ·协同服务管理 Zookeeper第41页
   ·本章小结第41-42页
第五章 企业搜索引擎的用户查询第42-61页
   ·引言第42页
   ·网页信息匹配和检索第42-50页
     ·烟草本体词典的构建第42-45页
     ·中文分词技术第45-48页
     ·语义相似度计算第48-49页
     ·面向特征的网页查重删除技术第49-50页
   ·索引库的建立第50-51页
   ·检索模块第51-57页
     ·概率模型算法第51-53页
     ·检索结果的排序第53-56页
     ·检索结果文档摘要第56-57页
   ·检索结果的特点分析第57-60页
   ·本章总结第60-61页
第六章 企业搜索引擎系统设计及实现第61-69页
   ·引言第61-62页
   ·浙江中烟营销搜索引擎系统设计第62-65页
     ·系统的需求分析第62页
     ·系统的总体架构第62-64页
     ·系统架构设计第64-65页
   ·系统开发环境第65页
   ·烟草领域本体构建第65-66页
   ·人机交互界面第66-68页
   ·本章总结第68-69页
第七章 总结与展望第69-71页
   ·全文总结第69-70页
   ·研究展望第70-71页
参考文献第71-73页
致谢第73-74页
攻读学位期间的研究成果第7页

论文共74页,点击 下载论文
上一篇:基于图像低层特征的领带花型检索研究
下一篇:医院体检管理信息系统的开发