首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于语义分析的主题信息采集技术的研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-17页
   ·论文研究背景第10-14页
     ·Web信息采集的研究现状第10-12页
     ·传统Web信息采集存在的问题第12-13页
     ·基于主题的Web信息采集的优点第13-14页
   ·研究内容第14-15页
   ·本文结构第15-17页
第2章 基于语义分析的主题Web信息采集模型第17-26页
   ·基于主题的Web信息采集的基本原理第17-18页
   ·主题页面在Web上的分布特征第18-20页
   ·基于语义分析的主题信息采集系统模型第20-22页
   ·主题选择策略第22-24页
     ·本体的定义第22-23页
     ·本体的作用与分类第23页
     ·传统的主题选择策略第23-24页
     ·基于本体的主题选择策略第24页
   ·链接预测及页面判定策略第24-26页
     ·链接预测策略第24-25页
     ·页面判定策略第25-26页
第3章 语义分析技术第26-35页
   ·中国知网第26-28页
     ·知网的结构第26-27页
     ·知网的知识描述语言第27-28页
   ·基于知网的语义相关度计算第28-32页
     ·相关度的概念第28-29页
     ·相关度计算原理及基于语义的词义消岐算法第29-32页
   ·基于知网的词语相似度计算第32-33页
     ·词语相似度的定义第32页
     ·基于知网的词语相似度计算第32页
     ·义原相似度第32-33页
   ·基于知网的词语义项集和义原集的提取算法第33-35页
     ·主题特征向量及义原集的获取第33-34页
     ·扩展元数据及页面标题义项集及义原集的获取第34-35页
第4章 链接与主题相关性判定算法研究第35-51页
   ·利用元数据的判定原理第35-36页
   ·根据扩展元数据的判定第36-38页
     ·基本概念第36页
     ·HTML扩展元数据第36-37页
     ·传统的基于扩展元数据的判定算法第37-38页
   ·根据页面间链接分析的判断第38-43页
     ·PageRank算法简介第39-40页
     ·PageRank算法分析第40页
     ·PageRank算法改进第40-43页
   ·基于语义分析的链接与主题相关性判定算法-KPageRank第43-51页
     ·KPageRank算法第43-46页
     ·基于语义的链接与主题的相似度计算-SimK(url)第46-47页
     ·扩展元数据与主题的相似度计算第47-48页
     ·基于语义的页面标题与链接的集合与主题的相似度计算第48-50页
     ·基于语义的页面与主题的相似度计算--Simk(A)第50-51页
第5章 页面与主题相关性判定算法研究第51-55页
   ·向量空间模型第51-52页
   ·基于语义的页面与主题的相关性判定算法第52-55页
     ·页面标题的获取第53页
     ·页面与主题的相关性判定算法第53-55页
第6章 系统模型实现及测试第55-65页
   ·Heritrix简介第55-59页
     ·Heritrix架构设计分析第55-57页
     ·Heritrix在主题信息采集模型中的应用第57-59页
   ·算法实现第59-60页
   ·实验第60-65页
     ·算法空间及时间复杂度分析第61-62页
     ·算法运行结果比对第62-65页
第7章 总结与展望第65-67页
   ·本文完成的主要研究及创新点第65页
   ·进一步的研究工作第65-67页
参考文献第67-70页
致谢第70-71页
攻读硕士学位期间发表的论文和参加科研项目情况第71页

论文共71页,点击 下载论文
上一篇:基于遗传算法的UPFC控制器的研究
下一篇:基于颜色与纹理的图像检索技术研究与实现