首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索引擎设计与研究

摘要第1-6页
Abstract第6-11页
第一章 绪论第11-18页
   ·搜索引擎的历史第11-12页
   ·搜索引擎的概念及其功能、分类第12-16页
     ·搜索引擎的概念第12页
     ·搜索引擎的功能第12页
     ·搜索引擎的分类第12-13页
     ·搜索引擎的发展阶段第13-15页
     ·搜索引擎的发展趋势第15-16页
   ·本文的主要工作和组织第16-18页
第二章 搜索引擎基本理论第18-28页
   ·搜索引擎基本结构、工作原理第18-20页
     ·搜索引擎组成结构第18页
     ·搜索引擎的工作原理第18-20页
   ·建立搜索引擎的关键技术第20-22页
   ·搜索引擎的性能指标第22页
   ·通用搜索引擎的不足第22-23页
   ·专业搜索引擎的产生背景第23-24页
   ·专业搜索引擎的系统结构第24-25页
   ·专业搜索引擎的优势第25-26页
   ·专业搜索引擎目前的热点----面向主题的搜索引擎的研究第26-27页
     ·主题搜索引擎简介第26页
     ·主题搜索引擎发展现状第26-27页
   ·小结第27-28页
第三章 主题爬虫相关技术第28-42页
   ·通用爬虫模型第28-32页
     ·通用爬虫的结构第28-31页
     ·通用爬虫的不足第31-32页
   ·主题爬虫模型第32-34页
     ·主题爬虫的原理第32-33页
     ·主题爬虫的结构第33-34页
   ·主题爬虫与URL主题相关性算法分析第34-39页
     ·基于文字内容的启发策略第34-39页
   ·主题爬虫与通用爬虫的区别第39-41页
   ·小结第41-42页
第四章 HTML解析器与分词技术实现第42-58页
   ·HTML文档结构第42-43页
     ·HTML简介第42页
     ·HTML链接结构第42-43页
     ·HTML结构树的概念第43页
   ·HTML解析器第43-49页
     ·框架结构第44-45页
     ·解析器实例分析第45-49页
   ·中文分词技术研究第49-57页
     ·中文分词简介第49-50页
     ·Javacc简介第50-53页
     ·Nutch中文分词分析第53-55页
     ·Nutch支持中文分词实例分析第55-57页
   ·小结第57-58页
第五章 Web页面链接与分布特性分析研究第58-65页
   ·基于超链接的页面分析算法第58-62页
     ·PageRank超链分析算法第59-60页
     ·HITS算法第60-61页
     ·Maximum Flow Communities第61-62页
   ·主题页面的分布特征第62-64页
     ·中心页面特性第62-63页
     ·主题关联特性第63页
     ·主题聚集特性第63页
     ·隧道特性第63-64页
   ·小结第64-65页
第六章 主题搜索引擎关键技术设计实现第65-80页
   ·向量空间模型简介第65-68页
   ·关键词集第68-69页
   ·关键词集和页面间的Ω-距离第69-70页
   ·系统架构第70-71页
   ·主题相关性判定的实现第71-73页
     ·文档的表示第71-72页
     ·词条权重的计算第72页
     ·主题相关性判定第72-73页
   ·基于Nutch的主题相关性搜索引擎的实现第73-80页
     ·Nutch爬虫实现过程第73-74页
     ·Nutch索引的建立第74-77页
     ·Nutch搜索的实现第77-78页
     ·Nutch搜索结果截图第78-80页
第七章 总结与展望第80-82页
   ·总结第80-81页
   ·展望第81-82页
致谢第82-83页
参考文献第83-87页
攻读硕士期间的研究成果及发表的学术论文第87页

论文共87页,点击 下载论文
上一篇:边坡与隧道相互作用分析及数学二次规划法应用
下一篇:上海市居家养老服务评估指标体系的构建