首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

中文搜索引擎的设计与实现

摘要第1-6页
ABSTRACT第6-7页
目录第7-9页
第1章 概述第9-16页
   ·课题背景及意义第9-11页
   ·国内外发展现状第11-12页
   ·课题的目标与主要工作第12-14页
     ·本课题的主要目标第12-13页
     ·本课题的主要工作第13页
     ·创新之处第13-14页
   ·论文的章节安排第14-16页
第2章 搜索引擎的工作原理及Sirgin的体系结构设计第16-24页
   ·搜索引擎的基本概念第16-17页
     ·用户任务第16-17页
     ·文档逻辑第17页
   ·基本要求第17-18页
   ·工作流程第18-22页
     ·网页搜集第18-20页
     ·预处理第20-21页
     ·查询服务第21-22页
   ·Sirgin的体系结构设计第22-23页
   ·本章小结第23-24页
第3章 Sirgtn的Web信息的搜集方式第24-30页
   ·网页搜集第24-26页
   ·多道搜集线程并行工作第26-27页
   ·避免网页重复搜集第27页
   ·利用蜘蛛搜集重要网页第27-28页
   ·本章小结第28-30页
第4章 Sirgin中的网页智能解析技术第30-42页
   ·预处理的系统结构第30-31页
   ·网页滤波第31-34页
   ·网页消重第34-35页
   ·中文分词第35-37页
   ·建立倒排文件第37-39页
   ·文本的压缩第39页
   ·网页库索引库第39-41页
   ·本章小结第41-42页
第5章 Sirgin的内部索引构建方式第42-63页
   ·文本搜索与检索第43-47页
     ·查询模式第43-44页
     ·相似度测量第44-47页
   ·索引与查询评价第47-51页
     ·基本倒排文档第47-49页
     ·基本的查询评价第49-50页
     ·索引词的位置第50-51页
   ·短语查询第51-52页
     ·短语查询评价第51-52页
     ·短语索引第52页
   ·索引的构筑第52-55页
     ·内存中倒排第52-53页
     ·基于排序的倒排第53-54页
     ·基于合并方式的倒排第54-55页
   ·索引的维护第55-57页
     ·重构第56页
     ·间歇性的合并第56页
     ·增量更新第56-57页
     ·选择一种合适策略第57页
   ·提高索引效率的方法第57-61页
     ·参数编码第57-60页
     ·倒排列表的压缩第60-61页
   ·本章小结第61-63页
第6章 Sirgin信息查询的实现方法第63-73页
   ·查询服务的系统结构第63页
   ·缓存机制第63-64页
   ·预排序第64-69页
     ·链接分析第65-66页
     ·PageRank技术第66-67页
     ·Hits第67-69页
   ·基于PageRank改进的SpRank算法第69-71页
     ·关于PageRank第69页
     ·SpRank算法第69-71页
   ·查询服务的实现第71-72页
   ·本章小结第72-73页
第7章 总结与展望第73-75页
   ·本文总结第73页
   ·进一步的研究工作第73-75页
参考文献第75-83页
致谢第83-84页
研究生期间发表文章第84页

论文共84页,点击 下载论文
上一篇:增强型网页过滤系统研究与实现
下一篇:基于Web挖掘的纺织专业搜索引擎设计