首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据管理和数据挖掘技术的研究和应用

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-12页
   ·课题研究背景和意义第9-10页
   ·论文的主要工作第10-11页
   ·论文的主要成果第11页
   ·论文的章节安排第11-12页
第二章 相关技术综述第12-27页
   ·关系型数据库简介第12-15页
     ·关系数据库结构第12-13页
     ·数据库系统模型第13页
     ·数据库设计范式第13-15页
   ·COM组件和数据库连接技术第15-18页
     ·COM组件第15-16页
     ·数据库连接技术第16-18页
   ·基于Lucene的索引模型第18-24页
     ·Lucene简介第18-19页
     ·Lucene索引结构第19-20页
     ·倒排索引结构第20-21页
     ·Lucene的评分机制第21-22页
     ·中文分词算法第22-24页
   ·文本分类算法概述第24-27页
     ·VSM分类法(中心向量)第24-25页
     ·Naive Bayes分类法第25-26页
     ·KNN分类法第26-27页
第三章 数据管理和数据挖掘系统的设计与实现第27-54页
   ·系统的总体设计第27-28页
   ·结构化数据解析存储系统设计第28-30页
   ·数据解析模块的实现第30-37页
     ·XML文件结构详解第30页
     ·XML解析第30-33页
     ·测试的准备和目的第33页
     ·测试结果和结果分析第33-34页
     ·数据解析模块的代码实现第34-37页
   ·数据管理模块的实现第37-42页
     ·数据管理的主要内容第37页
     ·数据格式的转换第37-38页
     ·数据表的设计第38-39页
     ·数据插入时的数据管理第39-41页
     ·数据存储时的数据管理第41-42页
   ·数据查询模块的实现第42-43页
   ·SQL语句在数据解析存储中的应用第43-45页
   ·全文分类检索系统设计第45-46页
   ·全文分类检索系统各模块的实现第46-53页
     ·全文分类检索系统程序总流程第46-48页
     ·索引建立的实现第48-49页
     ·索引管理的实现第49页
     ·用户查询的实现第49-51页
     ·Lucene的结果排序优化第51-53页
   ·本章总结第53-54页
第四章 文本分类系统设计第54-72页
   ·文本分类系统框架图第54-55页
   ·分类器性能指标第55-56页
   ·特征提取算法的选择第56-63页
     ·文档词频信息第56-57页
     ·特征提取算法第57-59页
     ·TF-IDF模型第59页
     ·特征提取算法实验过程和性能比较第59-63页
   ·文本分类算法的对比选择第63-68页
     ·VSM分类法第63-64页
     ·Naive Bayes分类法第64-65页
     ·KNN分类法第65页
     ·分类算法的实验测试和性能比较第65-68页
   ·系统的算法最终选择和实现第68-70页
   ·算法的原理分析和优化可行性第70页
   ·本章总结第70-72页
第五章 文本分类算法优化和测试第72-80页
   ·测试环境的搭建第72-73页
   ·文本过滤的优化第73-74页
   ·词频过滤的优化第74-76页
   ·特征词的选择优化第76-77页
   ·K的选择优化第77-78页
   ·优化方案和分类性能测试第78-79页
   ·本章小结第79-80页
第六章 总结第80-81页
   ·本文所做的工作第80页
   ·有待进一步研究的问题第80-81页
参考文献第81-83页
致谢第83-84页
作者攻读学位期间发表的学术论文目录第84页

论文共84页,点击 下载论文
上一篇:图库技术的研究及应用
下一篇:基于云计算平台的海量图片存储系统设计与实现