首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎主题特征提取及相关度算法研究

摘要第1-6页
Abstract第6-11页
第一章 绪论第11-20页
   ·课题研究的背景和意义第11页
   ·垂直搜索引擎的研究现状第11-13页
     ·基于内容的搜索第11-12页
     ·基于链接分析的搜索第12-13页
   ·课题研究内容和技术难点第13-17页
     ·网页主题特征提取第13-15页
     ·网页主题的相关度分析第15-17页
   ·课题研究的创新点和难点第17-20页
第二章 搜索引擎发展概述第20-37页
   ·搜索引擎简介第20-27页
     ·搜索引擎产生的背景第20页
     ·搜索引擎的发展现状第20-23页
     ·搜索引擎的分类第23-25页
     ·搜索引擎的性能评价指标第25-27页
   ·通用搜索引擎第27-33页
     ·通用搜索引擎的基本工作原理第27-31页
     ·通用搜索引擎面临的挑战和发展趋势第31-33页
   ·垂直搜索引擎第33-37页
     ·垂直搜索引擎产生的背景第33-34页
     ·垂直搜索引擎的特点第34-35页
     ·垂直搜索引擎的发展第35-37页
第三章 垂直搜索引擎技术分析第37-55页
   ·垂直搜索引擎工作原理第37-43页
     ·垂直搜索引擎的系统架构第37-39页
     ·垂直搜索引擎的工作流程第39-41页
     ·垂直搜索引擎的搜索策略第41-43页
   ·信息检索模型第43-47页
     ·布尔模型第43-44页
     ·向量空间模型第44-45页
     ·概率模型第45-46页
     ·神经网络模型第46-47页
   ·网络机器人信息采集技术第47-50页
     ·Web Spider爬行算法第47页
     ·Web Spider主题采集策略第47-48页
     ·Web Spider遍历优先策略第48-49页
     ·Web Spider页面内容预测技术第49-50页
   ·信息索引技术第50-55页
     ·倒排文件索引第50-52页
     ·后缀树与后缀数组第52页
     ·Web页面的加权索引第52-55页
第四章 文档特征提取模型研究及改进第55-84页
   ·页面解析和中文分词第55-60页
     ·页面解析的任务和过程第55-56页
     ·中文分词技术第56-60页
   ·中文分词算法的改进第60-68页
     ·正向最大匹配(MM)算法第60-63页
     ·基于MM分词算法的改进第63-68页
   ·改进的自适应分类模型IVSM第68-72页
     ·现有信息检索模型的局限性第68-69页
     ·VSM模型分析第69-70页
     ·自适应分类模型IVSM设计第70-72页
   ·基于词语相关度的特征提取第72-84页
     ·分块主题爬行第72-76页
     ·特征抽取方法第76-79页
     ·自动主题聚类第79-84页
第五章 相关度排序算法的研究与改进第84-96页
   ·网页评价要素分析第84-85页
   ·基于网页链接关系的排序第85-89页
     ·PageRank算法第85-86页
     ·HITS算法第86-88页
     ·SALSA算法第88-89页
   ·基于内容相关度的排序第89-92页
     ·现有算法分析第89-90页
     ·排序算法的选择第90-92页
   ·改进的排序算法V-Page-Rank第92-96页
     ·现有排序算法的局限性第92-93页
     ·基于内容和链接结构的V-Page-Rank算法第93-96页
第六章 基于IVSM和V-Page-Rank的搜索引擎系统第96-116页
   ·系统开发概述第96-98页
     ·系统开发环境第96页
     ·系统功能介绍第96-97页
     ·系统体系结构第97-98页
   ·信息采集和更新策略设计第98-103页
     ·基于V-Page-Rank的综合评价采集策略第98-101页
     ·搜索引擎页面更新策略第101-103页
   ·功能模块设计第103-116页
     ·信息采集模块第103-111页
     ·索引模块第111-114页
     ·检索模块第114-116页
第七章 系统运行与性能分析第116-125页
   ·垂直搜索引擎评价方法第116-118页
   ·系统部署和运行第118-122页
   ·系统性能分析第122-125页
第八章 结论与展望第125-127页
参考文献第127-133页
攻读学位期间取得的研究成果第133-134页
致谢第134页

论文共134页,点击 下载论文
上一篇:组胺作为一种交感神经递质的新证据
下一篇:宋代上层社会消费研究