首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

文本挖掘关键技术研究及实现

摘要第1-6页
Abstract第6-13页
第一章 绪论第13-16页
   ·问题的来源第13-14页
   ·研究目的第14页
   ·本文的主要工作第14页
   ·本文创新点第14-15页
   ·全文章节安排第15-16页
第二章 文本挖掘技术概述第16-22页
   ·文本挖掘技术的含义第16页
     ·数据挖掘第16页
     ·文本挖掘第16页
   ·Web文本挖掘第16-17页
   ·文本挖掘的方法第17-20页
     ·文本的特征表示第17页
     ·文本的特征子集的选取第17-18页
     ·文本分类第18-19页
     ·文本聚类第19-20页
   ·文本挖掘模型第20-21页
   ·挖掘的应用前景第21页
   ·本章小结第21-22页
第三章 中文分词算法研究及其实现第22-37页
   ·中文词语切分的方法第22-24页
     ·基于字符串匹配的分词方法第22-23页
     ·基于理解的分词方法第23页
     ·基于统计的分词方法第23-24页
   ·分词中的两大难题第24-25页
     ·歧义识别第24-25页
     ·新词识别第25页
   ·歧义消除算法研究第25-28页
     ·一种简单的歧义消除法第25-27页
     ·改进的消除歧义算法第27-28页
   ·分词词典数据库的设计第28-30页
   ·分词的效率分析第30-32页
     ·分词速度测试及其分析第31页
     ·分词精度测试及其分析第31-32页
   ·未登录词识别的学习研究第32-33页
     ·未登录词的识别策略第32页
     ·数字的识别第32-33页
   ·对比其他分词程序第33-36页
     ·中科院ICTCLAS第33-34页
     ·海量分词研究版第34页
     ·性能比较第34-36页
   ·本章小结第36-37页
第四章 文本特征选择方法的研究与设计第37-50页
   ·特征选择模型的建立第37-38页
     ·矢量空间模型VSM第37-38页
     ·布尔模型第38页
   ·几种常见特征选择方法第38-41页
     ·文档频率DF(Document Frequency)第38页
     ·信息增益IG(Information Gain)第38-39页
     ·互信息MI(Mutual Information)第39页
     ·X~2统计CHI(Chi-square, CHI)第39-40页
     ·期望交叉熵ECE(Expected Cross Entropy)第40页
     ·文本证据权(the Weight of Evidence for Text)第40页
     ·信息增益与互信息相结合第40-41页
   ·改进后的特征选择系统设计第41-45页
     ·文本预处理第42页
     ·统计词频以及文档频率第42-43页
     ·计算信息增益以及互信息的值第43-44页
     ·特征向量的获取第44页
     ·计算和提取文本类的特征向量第44-45页
   ·语料库及数据库的建设第45-46页
     ·语料库第45页
     ·数据库第45-46页
   ·测试、比较及分析第46-49页
     ·特征选择准确度对比及分析第48-49页
   ·本章小结第49-50页
第五章 基于向量空间模型(VSM)文本分类技术研究及实现第50-61页
   ·文本分类简介第50页
   ·文本分类的常用方法第50-52页
     ·KNN方法第51页
     ·概率模型第51页
     ·最小二乘拟合方法(LLSF)和支持向量机(SVM)第51页
     ·非线性模型可以分为层次模型和网络模型第51-52页
     ·组合模型第52页
     ·基于特征依赖性算法第52页
   ·采用KNN方法实现文本分类第52-54页
     ·分类器原理第53-54页
     ·KNN(K最近邻居)算法描述第54页
   ·改进权重和K近邻方法相结合的文本自动分类方法第54-56页
     ·经典权重计算方法第54-55页
     ·改进的权重计算公式涉及的两个概念第55页
     ·改进的权重计算公式第55-56页
   ·改进后的分类系统设计第56-58页
     ·训练集文本预处理第56页
     ·特征词的统计及选择第56-57页
     ·构造分类器第57页
     ·待分类文本特征表示第57-58页
     ·分类输出第58页
   ·分类评价方法第58-59页
   ·实验结果及分析第59-60页
     ·实验过程第59页
     ·结果及分析第59-60页
   ·本章小结第60-61页
第六章 总结与展望第61-64页
   ·本文主要工作第61-63页
   ·下一步的研究工作第63-64页
参考文献第64-66页
在学期间撰写的论文第66页
在学期间参加的科研项目第66页

论文共66页,点击 下载论文
上一篇:数据流中的频繁闭合模式挖掘研究
下一篇:层状化合物三氧化钼的制备及其光电性质研究