摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-13页 |
·选题背景和意义 | 第9页 |
·国内外研究现状 | 第9-11页 |
·本文拟解决的关键问题 | 第11-12页 |
·本文内容及组织结构 | 第12-13页 |
第2章 相关理论研究 | 第13-19页 |
·XML相关技术 | 第13-15页 |
·XML概述 | 第13-14页 |
·XML做为中介转换的优势 | 第14-15页 |
·数据清洗的相关理论 | 第15-18页 |
·数据质量概述与数据质量问题 | 第15-16页 |
·数据清洗概述 | 第16-17页 |
·数据清洗的方法 | 第17-18页 |
·数据清洗的评价标准 | 第18页 |
·本章小结 | 第18-19页 |
第3章 Web数据存储与清洗的总体设计 | 第19-24页 |
·总体设计思想 | 第19-20页 |
·系统的整体模型框架 | 第20-22页 |
·系统的应用背景 | 第22-23页 |
·本章小结 | 第23-24页 |
第4章 基于改进的自动摘要的关键字提取算法研究与实现 | 第24-34页 |
·词共现模型 | 第24-26页 |
·自动摘要概述 | 第24-25页 |
·词共现模型 | 第25-26页 |
·关键字的提取 | 第26-27页 |
·主题划分与主题词的提取 | 第26页 |
·主题间连接词的提取 | 第26-27页 |
·关键字提取 | 第27页 |
·算法的改进 | 第27-29页 |
·基于关键字词性的改进 | 第27页 |
·基于标题隐含关键字的改进 | 第27-28页 |
·算法描述及评价 | 第28-29页 |
·基于改进的自动摘要算法的关键字提取的设计与实现 | 第29-33页 |
·基于改进的自动摘要算法的关键字提取的设计 | 第29-30页 |
·基于改进的自动摘要算法的关键字提取的实现 | 第30-33页 |
·本章小结 | 第33-34页 |
第5章 基于XML数据存储技术研究与实现 | 第34-42页 |
·XML与数据库的映射 | 第34页 |
·XML与关系数据库的存储交互 | 第34-35页 |
·XML映射到关系数据库的实现 | 第35-41页 |
·本章小结 | 第41-42页 |
第6章 基于关键字匹配的数据清洗方法研究与实现 | 第42-58页 |
·数据清洗的一般方法 | 第42-50页 |
·属性清洗 | 第43-45页 |
·重复记录检测算法 | 第45-49页 |
·相似重复记录的处理与算法评价标准 | 第49-50页 |
·基于关键字匹配的数据清洗优化方法 | 第50-52页 |
·基于字段关键字匹配的优化算法 | 第50-51页 |
·算法描述 | 第51-52页 |
·基于数据清洗优化技术的重复记录清洗的设计与实现 | 第52-57页 |
·基于关键字匹配优化算法的重复记录清洗流程设计 | 第52-53页 |
·重复记录检测与清洗实现 | 第53-56页 |
·数据库清洗结果分析 | 第56-57页 |
·本章小结 | 第57-58页 |
第7章 总结与展望 | 第58-60页 |
·总结 | 第58-59页 |
·今后工作的展望 | 第59-60页 |
参考文献 | 第60-63页 |
致谢 | 第63-64页 |
攻读硕士研究生期间发表的论文及参与的项目 | 第64页 |