基于结构化向量空间模型的中文信息检索系统研究与实现

摘要	第1-4页
Abstract	第4-7页
第1章绪论	第7-13页
·研究背景	第7-8页
·研究现状	第8-10页
·课题来源	第10-11页
·论文的贡献	第11页
·论文组织	第11-13页
第2章 Web信息检索系统的工作原理和体系结构	第13-19页
·Web信息检索系统的分类	第13-15页
·目录式搜索引擎	第13-14页
·Robot搜索引擎	第14页
·元搜索引擎	第14-15页
·智能搜索引擎	第15页
·Web信息检索系统的工作原理和结构	第15-17页
·Web信息检索系统的性能指标	第17页
·本章小结	第17-19页
第3章页面采集器工作原理及设计	第19-25页
·网络爬虫的基本原理与结构	第19-21页
·网络爬虫的遍历算法	第21页
·网络爬虫的主要技术问题	第21-22页
·网络爬虫的设计和实现	第22-24页
·本章小结	第24-25页
第4章索引器工作原理及设计	第25-39页
·索引的组织和基本数据结构	第25-28页
·Hit	第25-26页
·正向索引	第26页
·倒排索引	第26-27页
·词典	第27-28页
·中文分词	第28-31页
·中文分词中的难点问题	第28-29页
·常用的分词算法	第29-31页
·索引的建立	第31-36页
·页面预处理	第31-32页
·页面的净化	第32-35页
·建立正向索引	第35-36页
·正向表转换为倒排索引	第36页
·索引的更新	第36-37页
·本章小结	第37-39页
第5章主要信息检索算法的研究	第39-47页
·基于关键字的检索	第39-40页
·布尔模型	第39页
·向量空间模型	第39-40页
·概率模型	第40页
·基于超链接的检索	第40-45页
·PageRank算法	第41-43页
·HITs算法	第43-44页
·SALSA算法	第44页
·贝叶斯算法	第44-45页
·信息检索算法的比较	第45页
·本章小结	第45-47页
第6章向量空间模型改进及检索器的设计	第47-53页
·传统向量空间模型	第47-50页
·传统向量空间模型以及基本思想	第47-49页
·传统向量空间模型的优点和缺点	第49-50页
·对向量空间模型的改进——结构化向量空间模型	第50-51页
·文档索引项分段权值	第50-51页
·查询向量与文档向量的相似度	第51页
·结构化向量空间模型的特点	第51页
·结构化向量空间模型与PageRank相结合的检索算法	第51-52页
·本章小结	第52-53页
第7章系统的设计与实现	第53-61页
·系统的整体框架	第53-54页
·功能模块设计	第54-59页
·数据源处理模块	第54-55页
·页面解析模块	第55-56页
·索引模块	第56-58页
·检索模块	第58-59页
·用户接口模块	第59页
·本章小结	第59-61页
第8章实验及结果分析	第61-69页
·实验数据	第61页
·实验目标	第61-62页
·实验结果以及分析	第62-68页
·实验结果	第62-67页
·实验分析	第67-68页
·本章小结	第68-69页
结论	第69-71页
参考文献	第71-74页
攻读硕士学位期间所发表的学术论文	第74-75页
致谢	第75页