首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎数据分析技术的研究与实现

摘要第1页
ABSTRACT第3-7页
第一章 引言第7-11页
   ·选题背景及意义第7-9页
     ·搜索引擎的兴起和发展第7页
     ·搜索引擎目前存在的问题第7-9页
   ·垂直搜索引擎的国内外现状第9-10页
   ·本文主要工作第10-11页
第二章 搜索引擎综述第11-17页
   ·搜索引擎的分类第11-13页
     ·基于机器人的搜索引擎第11页
     ·目录式搜索引擎第11-12页
     ·元搜索引擎第12页
     ·垂直搜索引擎第12-13页
   ·搜索引擎的评价指标第13页
   ·通用搜索引擎的系统结构第13-15页
   ·搜索引擎的工作流程第15-17页
第三章 图书主题垂直搜索引擎系统的总体设计第17-21页
   ·系统的设计第17-20页
     ·系统结构设计第17-19页
     ·数据结构设计第19-20页
   ·系统面临的问题和解决方案第20-21页
     ·数据源的确定第20页
     ·信息抽取和数据的结构化第20页
     ·分词词库的组织第20页
     ·数据的索引设计第20-21页
第四章 页面分析和页面信息抽取方式的应用第21-30页
   ·页面的分析和预处理第21-24页
     ·页面的预处理第21-22页
     ·页面的表示第22-24页
   ·信息抽取和数据的结构化第24-29页
     ·信息抽取方式研究第24-27页
       ·基于自然语言处理方式的信息抽取第25页
       ·基于包装器归纳方式的信息抽取第25-26页
       ·基于ONTOLOGY 方式的信息抽取第26页
       ·基于HTML 结构的信息抽取第26-27页
       ·本文采取的信息抽取方式特点第27页
     ·包装器的设计第27-29页
       ·包装器的生成第27-28页
       ·包装器的归纳学习第28-29页
   ·页面数据的重新存储第29-30页
第五章 数据索引模块的设计与实现第30-41页
   ·中文分词技术的应用第30-36页
     ·中文分词算法研究第30-32页
     ·中文分词中的关键问题第32-33页
       ·通用词表和切分规范第32页
       ·歧义切分字段第32-33页
       ·未登录词识别第33页
     ·切分原理第33-35页
       ·词库组织第33-34页
       ·切分方法第34-35页
     ·分词系统的实现和切分结果对比分析第35-36页
   ·数据索引的设计和实现第36-40页
     ·索引的目的和原理第36-37页
     ·索引文件结构第37-39页
     ·索引数据组织第39页
     ·索引文件导出过程第39-40页
   ·本章总结第40-41页
     ·存在的问题第40页
     ·改进的方法第40-41页
第六章 检索结果的分析和用户查询接口的实现第41-47页
   ·检索结果的相关度分析第41-44页
     ·TF/IDF 算法第42-43页
     ·优化的TF/IDF第43页
     ·检索结果的排序第43-44页
   ·查询接口实现原理第44-46页
     ·检索过程第44-45页
     ·用户查询接口的实现第45-46页
   ·本章总结第46-47页
     ·存在的问题第46页
     ·可改进的地方第46-47页
第七章 总结与展望第47-49页
参考文献第49-52页
致谢第52-53页
在学期间发表的学术论文和参加科研情况第53页

论文共53页,点击 下载论文
上一篇:基于Ajax和J2EE的Web应用架构研究与设计
下一篇:止痛贴膏剂的制备工艺及质量标准研究