首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向Web文本的数据清洗关键技术的研究与实现

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·课题背景第7页
   ·研究现状第7-8页
   ·研究内容与组织结构第8-11页
第二章 Web文本数据仓库第11-21页
   ·数据仓库第11-14页
     ·数据仓库的概念第11页
     ·数据仓库的特点第11-12页
     ·数据仓库与传统数据库的区别第12-13页
     ·数据仓库的体系结构第13-14页
   ·Web文本数据仓库第14-19页
     ·Web文本数据仓库与传统数据仓库的区别第14-15页
     ·Web文本数据仓库的构建方法第15-16页
     ·Web文本数据仓库的设计第16-19页
   ·本章小结第19-21页
第三章 Web页面的分析与处理第21-29页
   ·Web页面的存在方式第21-22页
     ·HTML的格式第21-22页
     ·HTML的特点第22页
   ·Web页面的处理第22-27页
     ·HTML的树型结构第23-24页
     ·HTML树结构解析第24-27页
   ·本章小结第27-29页
第四章 Web文本信息抽取第29-43页
   ·信息抽取技术综述第29-30页
     ·信息抽取的概念第29页
     ·信息抽取的任务第29-30页
   ·文本分词的实现第30-34页
     ·文本分词技术第30-32页
     ·文本分词模块第32-34页
   ·关键词提取的实现第34-37页
     ·关键词提取技术第34-36页
     ·关键词提取模块第36-37页
   ·自动摘要的实现第37-41页
     ·自动摘要技术第37-39页
     ·自动摘要模块第39-41页
   ·本章小结第41-43页
第五章 Web文本分类与相似文本清洗第43-57页
   ·Web文本分类第43-51页
     ·Web文本分类概述第43-44页
     ·Web文本预处理第44-47页
     ·基于SVM的Web文本分类技术第47-49页
     ·Web文本分类的设计与实现第49-51页
   ·Web相似文本清洗第51-55页
     ·文本相似度概述第51-52页
     ·文本相似度计算方法第52-53页
     ·相似文本清洗模块的设计与实现第53-55页
   ·本章小结第55-57页
第六章 面向Web文本的数据清洗系统设计与实现第57-75页
   ·系统体系结构第57-58页
   ·系统功能模块组成第58-61页
     ·文本数据抽取模块第58-59页
     ·文本数据转换模块第59-60页
     ·文本数据装载模块第60-61页
   ·系统详细设计第61-66页
     ·文本分词与关键词详细设计第62-63页
     ·自动摘要详细设计第63-65页
     ·文本分类详细设计第65-66页
     ·相似文本清洗详细设计第66页
   ·系统运行实现第66-73页
   ·本章小结第73-75页
第七章 总结与展望第75-77页
   ·研究工作的总结第75页
   ·趋势与展望第75-77页
致谢第77-79页
参考文献第79-83页
在读期间发表论文第83页

论文共83页,点击 下载论文
上一篇:基于嵌入式Linux的扫描控制软件系统设计与实现
下一篇:面向系统集成领域的多Agent协作机制的研究