基于可信度和语义相似度的网页信息甄选研究

摘要	第5-6页
Abstract	第6页
1 绪论	第11-25页
1.1 论文研究背景与意义	第11-13页
1.1.1 研究背景	第11-12页
1.1.2 研究意义	第12-13页
1.2 国内外研究现状	第13-20页
1.2.1 网络信息可信度研究现状分析	第13-16页
1.2.2 网页相似性研究现状分析	第16-19页
1.2.3 网页信息甄选研究现状分析	第19-20页
1.3 研究问题、内容与方法	第20-23页
1.3.1 研究目标与问题	第20-21页
1.3.2 研究的主要内容	第21-22页
1.3.3 研究方法	第22-23页
1.4 本文的创新点	第23页
1.5 本文的内容组织结构	第23-24页
1.6 本章小结	第24-25页
2 研究的理论基础与技术方法	第25-39页
2.1 网页信息可信度评估理论	第25-28页
2.1.1 信息可信度的定义	第25-26页
2.1.2 网页信息的属性和特点	第26-27页
2.1.3 网页信息可信度的评估标准	第27-28页
2.2 网页相似度计算理论与方法	第28-31页
2.2.1 向量空间模型	第28-29页
2.2.2 网页相似性特点	第29-30页
2.2.3 相似网页识别的基本流程	第30-31页
2.3 文本语义相似度计算方法与理论	第31-35页
2.3.1 词语语义相似度与计算方法	第31-32页
2.3.2 文本语义相似度计算的常用方法	第32-35页
2.4 Web信息抽取方法与理论	第35-38页
2.4.1 Web信息抽取的内涵	第35-36页
2.4.2 Web正文信息抽取的主要方法	第36-38页
2.5 本章小结	第38-39页
3 网页信息可信度评估体系构建与计算方法研究	第39-54页
3.1 网页信息可信度评估体系构建	第39-46页
3.1.1 网页信息可信度评估指标分析	第39-42页
3.1.2 可信度评估指标体系的构成研究	第42-46页
3.2 网页信息可信度评估流程分析	第46-48页
3.3 网页信息可信度计算方法研究	第48-53页
3.3.1 可信度计算公式	第48-49页
3.3.2 指标权重选取方法研究	第49-53页
3.4 本章小结	第53-54页
4 网页语义相似度计算方法与分析	第54-66页
4.1 基于DOM的网页正文内容抽取研究	第54-61页
4.1.1 网页内容和结构分析	第54-56页
4.1.2 基于DOM的正文提取算法分析与实现	第56-61页
4.2 基于LDA的网页语义相似度计算方法研究	第61-65页
4.2.1 基于LDA的文本建模分析	第61-64页
4.2.2 语义相似度计算研究	第64-65页
4.3 本章小结	第65-66页
5 系统设计与实验分析	第66-77页
5.1 系统功能与结构设计	第66-69页
5.1.1 实验环境介绍	第67-68页
5.1.2 系统功能模块设计	第68-69页
5.2 实验过程分析	第69-74页
5.2.1 数据库结构设计	第69-70页
5.2.2 系统主要界面分析	第70-74页
5.3 实验结果分析	第74-76页
5.4 本章小结	第76-77页
6 总结与展望	第77-79页
6.1 全文总结	第77-78页
6.2 工作展望	第78-79页
致谢	第79-80页
参考文献	第80-84页