首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向领域的垂直搜索引擎的研究与实现

摘要第1-6页
ABSTRACT第6-9页
第1章 引言第9-14页
   ·课题研究背景与意义第9-10页
   ·国内外研究现状(相关研究)第10-11页
   ·本文研究的主要内容第11-12页
   ·论文的组织结构第12-14页
第2章 垂直搜索引擎的核心技术第14-28页
   ·搜索引擎的组成及工作原理第14-15页
   ·垂直搜索引擎的特征第15-16页
   ·主题爬行技术第16-23页
     ·通用爬虫与主题爬虫第16-17页
     ·主题爬行的理论基础第17页
     ·主题爬行策略研究第17-23页
   ·文本聚类技术第23-27页
     ·文本聚类的过程第24-25页
     ·传统的聚类算法第25-27页
   ·本章小结第27-28页
第3章 主题爬虫搜索算法的改进第28-41页
   ·主题描述方法及存在问题第28-30页
     ·主题描述方法第28-30页
     ·存在的问题第30页
   ·基于分类法的目录式主题描述法第30-35页
     ·目录式主题描述法第30-33页
     ·主题向量表示第33-35页
   ·待爬行链接优先级计算第35-37页
     ·主题链接优先级的规范化描述第36页
     ·基于锚文本的链接优先级计算第36-37页
   ·自适应主题爬行算法第37-40页
     ·不同粒度优先级计算策略顺序第37-38页
     ·路径探测深度第38页
     ·自适应主题爬行算法第38-40页
   ·本章小结第40-41页
第4章 搜索结果聚类研究第41-53页
   ·网页文本预处理——中文分词第41-45页
     ·中文分词分类第42-43页
     ·基用于垂直搜索引擎中的不足第43-44页
     ·适用于垂直搜索引擎的分词方法第44-45页
   ·基于主题短语的搜索结果聚类第45-52页
     ·文档的特征项提取第45-46页
     ·主题短语的提取第46-48页
     ·改进的k-means聚类算法第48-52页
   ·本章小结第52-53页
第5章 实验与结果分析第53-65页
   ·系统设计第53-55页
     ·基本功能需求分析第53页
     ·功能模块分析第53-54页
     ·开发环境设置第54-55页
   ·系统实现第55-62页
     ·爬虫模块实现第55-58页
     ·信息抽取模块实现第58-60页
     ·信息索引模块实现第60-62页
     ·用户接口模块实现第62页
   ·结果对比和评价第62-65页
第6章 总结与展望第65-67页
   ·总结第65页
   ·展望第65-67页
参考文献第67-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:海事信息标准化协同管理系统的研究
下一篇:基于BPM的海关货物通关流程建模研究