Web网页去噪及信息提取算法的研究与应用
摘要 | 第1-6页 |
Abstract | 第6-12页 |
1 绪论 | 第12-18页 |
·研究背景 | 第12-13页 |
·国内外研究现状 | 第13-15页 |
·存在问题 | 第15-16页 |
·研究意义 | 第16页 |
·论文结构 | 第16-18页 |
2 常见的网页去噪及信息提取技术 | 第18-22页 |
·基于网页分块的网页去噪模型 | 第18-19页 |
·基于模板的网页去噪方法 | 第19-20页 |
·基于视觉模型的Web页面信息提取算法 | 第20-22页 |
3 相关知识介绍 | 第22-30页 |
·Web | 第22-23页 |
·XML | 第23-24页 |
·CSS | 第24页 |
·DOM | 第24-26页 |
·超级文本标记语言 | 第26页 |
·Web数据挖掘技术 | 第26-30页 |
4 结构模型 | 第30-42页 |
·整体框架模型 | 第30-33页 |
·Web信息提取和Web信息检索 | 第30页 |
·信息提取的整体框架 | 第30-32页 |
·信息提取的结构 | 第32-33页 |
·待提取信息页面的获取 | 第33页 |
·页面分块与净化 | 第33-40页 |
·关联规则经典算法分析 | 第40-42页 |
5 系统实现与分析 | 第42-50页 |
·网页去噪及信息提取过程 | 第42-45页 |
·信息选取 | 第42页 |
·网页块的划分去噪 | 第42-45页 |
·系统设计 | 第45-50页 |
·性能评价指标 | 第45页 |
·设计目标 | 第45页 |
·系统运行环境及实现结果 | 第45-50页 |
6 总结与展望 | 第50-52页 |
参考文献 | 第52-56页 |
致谢 | 第56-57页 |
作者简介及读研期间主要科研成果 | 第57页 |