首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

企业集团的智能搜索引擎平台的建立

摘要第1-5页
Abstract第5-10页
第一章 绪论第10-15页
   ·论文研究目的和意义第10-11页
   ·垂直搜索引擎概述第11-13页
     ·垂直搜索引擎介绍第11-12页
     ·垂直搜索引擎特点第12-13页
   ·本文主要工作第13-14页
   ·本文组织结构第14-15页
第二章 搜索引擎综述第15-21页
   ·WEB 信息搜索概述第15-18页
     ·搜索的三种形式第15-16页
     ·Web 信息检索系统的分类第16-18页
   ·搜索引擎体系结构第18-20页
     ·搜索引擎的结构第18-19页
     ·搜索引擎工作的体系结构第19-20页
   ·搜索引擎的排序算法第20页
   ·本章小结第20-21页
第三章 面向行业的聚焦网络爬虫第21-34页
   ·搜索引擎网络爬虫介绍第21-22页
     ·网络爬虫的陷阱第21页
     ·网络爬虫的评价指标第21-22页
   ·搜索引擎网络爬虫的分类及其工作方式第22-24页
   ·行业内网络爬虫的搜索策略第24-26页
     ·广度优先搜索策略第24-25页
     ·最佳优先的搜索策略第25-26页
       ·偏好“烟草”的爬虫第25-26页
       ·基于内容评价的搜索策略第26页
   ·爬虫的增量爬取第26-29页
     ·网页重访策略第26-28页
     ·烟草行业的网页重访策略第28-29页
   ·构建烟草行业网页库第29-31页
     ·网页库的云存储研究第29-31页
   ·业务数据采集第31-33页
     ·数据源第32页
     ·业务数据的抽取第32-33页
   ·本章小结第33-34页
第四章 企业搜索引擎的数据处理第34-57页
   ·行业内网页查重技术第34-37页
     ·网页查重技术发展历史第34-35页
     ·网页查重实现方法第35-37页
   ·中文分词技术第37-44页
     ·基于词典的分词法第37-39页
       ·最大匹配法(Maximum Match based approach)第38页
       ·逆向最大匹配法(Backward Maximum Matching method, BMM 法)第38-39页
       ·双向匹配法(Bi-direction Matching method, BM 法)第39页
     ·基于理解的分词第39页
     ·基于统计的分词第39-44页
       ·生成式统计分词第39-42页
       ·判别式统计分词第42-44页
   ·构建烟草行业本体词典第44-50页
     ·基于本体的关键词扩展策略第44-46页
     ·扩展方法第46-50页
       ·查询关键词转换为概念集第47页
       ·构造概念子树第47-49页
       ·语义相似度计算第49-50页
   ·搜索引擎的索引系统第50-53页
   ·网页重要性排序计算第53-56页
     ·PageRank 算法第54-56页
       ·PageRank 算法分析第56页
   ·本章小结第56-57页
第五章 企业搜索引擎的查询系统第57-68页
   ·网页信息检索第57-59页
     ·向量空间模型的算法第57-58页
     ·编辑距离算法(Levenshtein Distance)第58-59页
     ·本文检索算法第59页
   ·查询结果排序第59-61页
     ·词条相关性的评分标准第60-61页
     ·烟草行业的排序模型第61页
   ·生成搜索结果页第61-62页
   ·基于烟草行业的查询结果重排序第62-67页
     ·查询日志分析第62-63页
     ·重排序框架第63-67页
       ·二分图模型第64-65页
       ·用户点击日志的分析第65-67页
   ·本章小结第67-68页
第六章 浙江中烟搜索引擎系统第68-76页
   ·引言第68页
   ·浙江中烟搜索引擎系统设计第68-71页
     ·烟草领域本体构建第70-71页
   ·系统开发环境第71页
   ·系统展示第71-75页
     ·行业内专题搜索第72-75页
   ·本章总结第75-76页
第七章 总结与展望第76-78页
   ·全文总结第76-77页
   ·研究展望第77-78页
参考文献第78-81页
致谢第81-82页
攻读学位期间的研究成果第82页

论文共82页,点击 下载论文
上一篇:基于偶然性正确测试用例发现的软件错误定位方法
下一篇:测试方法对软件可靠性计算的影响分析