首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

主题网站的自动发现与判定方法研究

摘要第1-5页
ABSTRACT第5-11页
第一章 绪论第11-27页
   ·选题的背景及意义第11-13页
     ·问题提出第11-12页
     ·研究目的第12页
     ·研究意义第12-13页
   ·国内外研究的技术现状分析第13-24页
     ·相似网站的发现国内外研究现状第13-19页
     ·网页信息采集的国内外研究现状第19-22页
     ·相似性计算研究现状第22-24页
   ·论文架构与技术路线第24-25页
     ·研究内容第24页
     ·技术路线第24-25页
   ·主要工作及创新点第25-27页
第二章 相关理论研究第27-40页
   ·关键词提取技术第27-33页
     ·关键词提取概述第27页
     ·关键词提取的方法及评述第27-30页
     ·关键词提取关键过程第30-32页
     ·关键词提取评估方法第32-33页
   ·信息采集理论第33-36页
     ·网页采集概述与基本原理第33-35页
     ·网页采集相关技术第35-36页
   ·相似度计算理论第36-39页
     ·相似度计算应用范围第37页
     ·相似性计算常用方法第37-39页
   ·本章小结第39-40页
第三章 主题描述模型设计与相似度计算第40-49页
   ·样本网站分析第40-43页
     ·Web 页面分析过程第40-42页
     ·关键词权重计算第42-43页
   ·主题描述模型第43-46页
     ·确定网站关键词第43-45页
     ·构造主题模型过程第45-46页
   ·相似度处理算法第46-48页
     ·网站相似度概念的定义第46-47页
     ·算法描述第47-48页
     ·阈值的选择第48页
   ·本章小结第48-49页
第四章 主题网站发现方法与路径研究第49-60页
   ·利用 Google 进行主题网页的采集第49-55页
     ·Google 搜索引擎的体系结构第49-51页
     ·采集步骤第51-52页
     ·搜索关键词的选取第52页
     ·关键词的转换以及搜索页面 URL 生成第52-53页
     ·解析 Google 搜索页面第53-54页
     ·主题相关的网页存储策略第54-55页
   ·主题网站发现方法与步骤第55-58页
     ·网页 URL 分析第56页
     ·网页 URL 分析步骤第56-57页
     ·主题网站存储策略第57-58页
   ·主题网站的判定第58-59页
   ·本章小结第59-60页
第五章 主题网站发现实验验证第60-70页
   ·网站关键词的提取实验第60-66页
     ·实验样本网站选择背景介绍第60-61页
     ·样本网站关键词抽取实验第61-66页
   ·主题网站发现效果分析第66-67页
   ·相似度判定实验第67-69页
   ·本章小结第69-70页
第六章 总结与展望第70-72页
   ·总结第70页
   ·展望第70-72页
参考文献第72-76页
致谢第76-77页
在学期间的研究成果和发表的学术论文第77页

论文共77页,点击 下载论文
上一篇:基于OOPN的管理信息系统设计方法及应用研究
下一篇:一种基于关联规则挖掘的查询扩展算法及应用研究