首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索引擎的关键技术研究与实现

摘要第1-5页
ABSTRACT第5-10页
第1章 绪论第10-19页
   ·选题背景第10-11页
   ·通用搜索引擎概述第11-15页
     ·搜索引擎的分类第11-13页
     ·搜索引擎的结构及工作原理第13-15页
   ·主题搜索引擎技术第15-17页
     ·主题搜索引擎的定义第15页
     ·主题搜索引擎的研究现状第15-17页
     ·主题搜索引擎的优势第17页
   ·论文研究内容及组织结构第17-19页
第2章 主题搜索引擎的理论基础及关键技术第19-47页
   ·主题网络爬虫第19-25页
     ·主题爬虫的工作原理第19-20页
     ·主题爬虫的结构第20-22页
     ·主题爬虫与普通爬虫的区别第22-23页
     ·网络爬虫的搜索策略概述第23-25页
   ·信息抽取技术第25-31页
     ·HTML基本语法分析第26-28页
     ·网页预处理第28-30页
     ·网页中信息资源的提取第30-31页
   ·文本分类技术第31-40页
     ·文本表示模型第31-33页
     ·特征项提取第33-34页
     ·分类算法第34-36页
     ·改进的Naive Bayes分类算法第36页
     ·实验与数据分析第36-40页
   ·网页排序算法第40-46页
     ·PageRank算法第40-42页
     ·HITS算法第42-44页
     ·PageRank算法和HITS算法的比较第44-46页
   ·本章小结第46-47页
第3章 主题网络爬虫的搜索策略研究与设计第47-59页
   ·主题页面的分布特征第47-50页
     ·Hub/Authority特性第47-48页
     ·主题关联特性第48页
     ·主题聚集特性第48-49页
     ·主题孤岛特性第49-50页
   ·主题相关度预测第50-53页
     ·基于链接标记数据的预测第50-52页
     ·基于链接结构分析的预测第52-53页
   ·基于内容和链接分析的URL搜索策略第53-58页
     ·基于内容和链接分析的主题相关度预测第53-55页
     ·算法设计与实现第55-58页
   ·本章小结第58-59页
第4章 实验的建立与结果第59-64页
   ·性能评价指标第59-60页
   ·算法的实验比较与分析第60-62页
     ·ODP第60-62页
     ·实验结果分析第62页
   ·本章小结第62-64页
第5章 总结与展望第64-66页
   ·工作总结第64-65页
   ·工作展望第65-66页
参考文献第66-70页
致谢第70-71页
附录:攻读硕士学位期间公开发表的论文第71页

论文共71页,点击 下载论文
上一篇:基于YUV颜色空间和图论切割的阴影去除算法
下一篇:基于构件的软件产品线技术研究与实现