首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

文本挖掘预处理相关基础技术分析与应用研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-18页
   ·本论文的研究背景第10-12页
     ·社会所拥有的信息急增第10页
     ·信息化社会以信息流为核心来带动第10-12页
   ·本论文选题的意义第12-14页
   ·本论文选题的研究基础第14-17页
     ·研究现状第14-16页
     ·面临的问题第16-17页
   ·本论文选题的研究方向第17-18页
第二章 文本挖掘的定义和相关概念介绍第18-40页
   ·文本挖掘第18-19页
   ·文本信息抽取(Text Information Extraction)第19-21页
   ·文本分类第21-24页
   ·文本自动聚类第24-27页
     ·层次凝聚聚类第25-26页
     ·K均值聚类法第26-27页
   ·文本数据压缩(Text Data Compression)第27-29页
   ·文本数据处理(Text Data Processing)第29-30页
   ·分类技术使用的算法第30-37页
     ·基于词的分类技术第30-34页
     ·基于字的归类技术第34-35页
     ·基于对象的归类技术第35-37页
   ·精细化营销第37-40页
第三章 改进的全二分最大匹配分词算法第40-53页
   ·自动分词算法介绍第40-41页
   ·分词技术的难点第41-43页
   ·当前重要的基于词典分词算法第43-44页
   ·几种分词算法的比较第44-46页
   ·改进的全二分最大匹配快速分词算法第46-49页
     ·汉字编码体系第46页
     ·汉语词的特点第46-47页
     ·分词词典第47-48页
     ·词条查找算法第48-49页
   ·中文分词器设计第49-50页
   ·中文分词器实现第50-52页
   ·中文分词器分词结果分析第52页
   ·本章小结第52-53页
第四章 文本挖掘预处理的相关研究第53-66页
   ·向量空间模型第53-58页
     ·向量空间模型描述第53-55页
     ·向量空间模型存在问题第55-56页
     ·加权的VSM算法改进第56-58页
   ·文本特征向量建立过程第58-65页
     ·文本特征项的选择第58-59页
     ·使用互信息量进行特征项抽取第59-60页
     ·使用DF和互信息的混和预处理方式第60-62页
     ·试验结果以及分析第62-63页
     ·文本特征向量的权重第63-65页
   ·本章小结第65-66页
第五章 文本挖掘的相关算法第66-89页
   ·有监督学习和无监督学习第66-67页
   ·文本挖掘算法的实现第67-72页
     ·文本分类的过程第67-68页
     ·文本训练过程第68-72页
   ·文本挖掘算法KNN第72-83页
     ·K个最近邻居(K-Nearest-N eighbor)第72页
     ·基本概念第72-73页
     ·算法第73-74页
     ·实现第74-75页
     ·文本挖掘算法SVM第75-76页
     ·SVM简介第76页
     ·SMO及其改进算法简介第76-77页
     ·语义SVM第77-80页
     ·算法框架第80-83页
   ·文本挖掘朴素贝叶斯第83-86页
     ·朴素贝叶斯简介第83-84页
     ·信息几何和Fisher第84页
     ·两种特殊先验分布的讨论第84-86页
   ·文本分类权值第86-87页
   ·分类的评估指标第87页
   ·分类阈值的确定第87-89页
第六章 文本挖掘应用的系统结构框架研究第89-95页
   ·系统结构框架第89-90页
   ·系统设计第90-91页
   ·软件环境第91-95页
第七章 文本挖掘的应用设计与实践第95-106页
   ·文本挖掘在中医学中的应用第95-100页
     ·主题标引的机器学习方法第95-97页
     ·基于SVM的副题词抽取及组配第97-100页
   ·文本挖掘系统在中国移动客户需求挖掘中的应用第100-106页
     ·文本数据所蕴含的客户需求第100-102页
     ·移动客户需求挖掘系统应用框架第102-103页
     ·应用成果及展望第103-106页
第八章 总结第106-107页
   ·本文的主要工作第106页
   ·未来的工作展望第106-107页
参考文献第107-110页
致谢第110-111页
攻读学位期间发表论文第111页

论文共111页,点击 下载论文
上一篇:载重汽车底盘结构件的计算机辅助分析与设计
下一篇:基于MapX控件的导航软件的设计与实现