首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于网页分块思想的搜索引擎索引系统

中文摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-12页
   ·Web 页面区域划分研究的背景及意义第7-8页
   ·国内外研究现状第8-10页
   ·本文研究内容第10页
   ·论文的组织第10-12页
第二章 相关技术研究第12-26页
   ·当前Web 页面结构分析及语言规范第12-15页
     ·HTML语言介绍第12-13页
     ·XML语言介绍第13-14页
     ·XHTML语言介绍第14-15页
   ·DOM 树结构研究第15-22页
     ·DOM 技术介绍第15-16页
     ·DOM 树结构第16-18页
     ·DOM 树的操作第18-22页
   ·经典VIPS 算法第22-25页
   ·本章小结第25-26页
第三章 Web 页面区域划分算法第26-43页
   ·对VIPS 算法的改进第26-29页
     ·引入结构树深度阈值PDoT第26-28页
     ·引入叶子节点数阈值PNoB第28-29页
   ·改进算法流程与实现第29-38页
     ·改进算法流程第29-31页
     ·可视块提取第31-35页
     ·分割线提取第35-37页
     ·页面内容结构调整第37-38页
   ·改进算法与原算法的对比实验第38-42页
     ·爬取测试集第38-41页
     ·对比实验第41-42页
   ·本章小结第42-43页
第四章 基于改进VIPS 算法的搜索引擎索引系统第43-57页
   ·系统结构和模块划分第43-44页
   ·语义预处理层第44-51页
     ·中文分词技术概述第45-46页
     ·存储中文词典的Trie 树模块第46-48页
     ·中文词典读入模块第48-50页
     ·分词模块第50-51页
     ·分词结果统计模块第51页
   ·可视块分类层第51-54页
     ·预处理模块第51-52页
     ·构造分类器模块第52-53页
     ·正文块分类模块第53-54页
   ·改进的索引系统第54-56页
   ·本章小结第56-57页
第五章 实验结果与分析第57-61页
   ·实验数据介绍第57页
   ·实验结果的评价方法第57-58页
   ·实验结果与分析第58-60页
   ·本章小结第60-61页
第六章 总结与展望第61-62页
参考文献第62-65页
发表论文和科研情况说明第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:基于灰度差投影与贝叶斯分类器的表情识别研究
下一篇:基于垂直搜索及语义标注的安全缺陷库更新方法研究