基于维基百科的Web网页数据质量评估系统

摘要	第4-5页
Abstract	第5页
专用术语注释表	第8-9页
第一章绪论	第9-14页
1.1 研究的背景和意义	第9-10页
1.1.1 研究背景	第9页
1.1.2 研究意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 数据质量的研究	第10页
1.2.2 Web 数据质量的研究	第10-12页
1.3 研究内容与创新点	第12-13页
1.4 论文组织	第13-14页
第二章系统结构与背景知识	第14-21页
2.1 框架设计与模块划分	第14-15页
2.2 Web 数据质量背景知识	第15-18页
2.2.1 Web 数据质量维度框架	第15-17页
2.2.2 网页质量评估方法分类	第17-18页
2.3 机器学习背景知识	第18-20页
2.3.1 机器学习概念	第18页
2.3.2 机器学习分类	第18-19页
2.3.3 机器学习展望	第19-20页
2.4 本章小结	第20-21页
第三章维基网页采集	第21-26页
3.1 页面预处理	第21-22页
3.2 关键字提取	第22-24页
3.2.1 停用词与词性识别	第22-23页
3.2.2 图迭代算法	第23-24页
3.3 网页采集	第24-25页
3.4 本章小结	第25-26页
第四章维基网页质量评估	第26-35页
4.1 获取高质量维基网页	第26-30页
4.1.1 支持向量机	第26-28页
4.1.2 支持向量机的训练	第28-30页
4.1.3 支持向量机的使用	第30页
4.2 获取高相关度维基网页	第30-33页
4.2.1 LDA 模型	第30-32页
4.2.2 LDA 模型的使用	第32-33页
4.3 信息抽取	第33页
4.4 本章小结	第33-35页
第五章源网页质量评估	第35-44页
5.1 获取候选三元组	第35-36页
5.2 语义精确性计算	第36-40页
5.2.1 算法设计	第37-40页
5.3 语义完整性计算	第40-43页
5.3.1 算法设计	第41-43页
5.4 本章小结	第43-44页
第六章实验与分析	第44-51页
6.1 系统实现	第44-47页
6.1.1 系统开发工具	第44页
6.1.2 系统实现	第44-47页
6.2 实验对比	第47-51页
第七章总结与展望	第51-53页
7.1 总结	第51页
7.2 展望	第51-53页
参考文献	第53-56页
附录1 攻读硕士学位期间撰写的论文	第56-57页
附录2 攻读硕士学位期间参加的科研项目	第57-58页
致谢	第58页