首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于语义相似度的WEB结构挖掘研究及实现

摘要第1-4页
Abstract第4-8页
1 绪论第8-12页
   ·引言第8-9页
   ·研究概述第9-10页
   ·本论文主要工作及组织结构第10-12页
2 Web数据挖掘与语义相似度第12-27页
   ·Web数据挖掘概述第12-13页
   ·Web数据挖掘的类别第13-17页
     ·Web内容挖掘第13-14页
     ·Web使用挖掘第14-15页
     ·Web结构挖掘第15-17页
   ·Web数据挖掘流程第17-18页
   ·Web数据挖掘的应用前景第18-19页
   ·语义相似度的含义及分类第19-21页
   ·《知网》语义字典第21-26页
     ·《知网》简介第21-22页
     ·《知网》的系统结构第22-23页
     ·《知网》中的描述语言第23-26页
   ·本章小结第26-27页
3 Web结构挖掘算法第27-35页
   ·PageRank算法第27-33页
     ·PageRank的基本思想第27页
     ·PageRank的数学定义第27-29页
     ·PageRank的修正式第29-30页
     ·PageRank的性能分析第30-32页
     ·PageRank的结果讨论第32-33页
   ·其它算法简介第33-34页
     ·HITS算法第33-34页
     ·阈值算法第34页
     ·SALSA算法第34页
   ·本章小结第34-35页
4 基于语义相似度的PageRank算法改进第35-49页
   ·PageRank算法存在的缺陷第35页
   ·现有的改进方法第35-38页
     ·Hilltop算法第35-36页
     ·主题相关的PageRank算法第36页
     ·PageRank-Pro算法第36-37页
     ·融入时间权值的改进算法第37页
     ·dPageRank算法第37-38页
   ·基于《知网》语义相似度的计算第38-46页
     ·语义距离及其与语义相似度的关系第38页
     ·相似度计算应考虑的因素第38-39页
     ·相似度基本算法第39-40页
     ·义原相似度的计算第40-42页
     ·词语相似度的计算第42-43页
     ·复合短语和句子的相似度计算第43-46页
   ·融入语义相似度的PageRank算法优化第46-48页
     ·锚文本第46-47页
     ·融入语义相似度的PageRank修正式第47-48页
   ·本章小结第48-49页
5 模拟系统的实现及测试第49-68页
   ·系统框架设计第49页
   ·数据收集阶段第49-52页
   ·网页预处理和解析模块第52-54页
   ·正向索引及倒排索引第54-55页
     ·正向索引第54页
     ·倒排索引第54-55页
   ·链接拓扑结构图第55-57页
   ·融入语义相似度的PageRank值计算第57-59页
   ·查询服务第59页
   ·测试结果分析第59-68页
     ·查准率分析第60-63页
     ·满意度分析第63-66页
     ·统计分析第66-67页
     ·分析总结第67-68页
6 总结与展望第68-69页
   ·本文的主要工作和研究成果第68页
   ·进一步的工作展望第68-69页
致谢第69-70页
参考文献第70-72页

论文共72页,点击 下载论文
上一篇:基于多尺度分析的多聚焦图像融合算法研究
下一篇:网络化数控机床故障设置与考核系统的设计与开发