文本挖掘技术在短信息过滤中的应用研究

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-13页
·研究背景及意义	第8-9页
·垃圾短信的当前的状况及危害	第9-11页
·垃圾短信的种类	第9-10页
·垃圾短信的危害	第10页
·我国垃圾短信的当前情况	第10-11页
·本论文的主要研究内容及论文的组织	第11-13页
·本论文的主要研究内容	第11-12页
·论文组织	第12-13页
第二章文本挖掘概述	第13-27页
·文本挖掘的基本概念	第13-14页
·文本分类的定义	第14页
·文本分类的一般流程	第14-15页
·文本预处理	第15-17页
·文本分词	第15-16页
·停用词过滤	第16-17页
·特征选择	第17-18页
·文本描述	第18-20页
·布尔模型	第18页
·空间向量模型	第18-19页
·概率模型	第19-20页
·概念模型	第20页
·分类方法	第20-26页
·支持向量机	第20-21页
·朴素贝叶斯算法	第21-22页
·基于神经网络的算法	第22-24页
·KNN算法	第24-26页
·本章小结	第26-27页
第三章短信文本分类技术的研究	第27-35页
·短信介绍	第27-28页
·短信过滤流程	第28-29页
·短信预处理	第29-32页
·短信语义模型	第32-34页
·本章小结	第34-35页
第四章基于特征选择的权值计算研究	第35-46页
·特征选择	第35-38页
·文档频率	第35-36页
·互信息	第36页
·信息增益	第36-37页
·期望交叉熵	第37页
·词条CHI统计法	第37-38页
·χ~2统计	第38页
·特征选取方法的比较	第38-40页
·性能指标	第38-39页
·实验结果与分析	第39-40页
·词语权重公式的改进	第40-45页
·传统tfidf公式	第40页
·特征加权	第40-45页
·结束语	第45-46页
第五章基于粗糙集的KNN短信分类	第46-61页
·粗糙集提出的背景及发展前景	第46页
·知识与知识库	第46-47页
·粗糙集的定义及其性质	第47-48页
·信息表知识表达系统与决策表	第48-49页
·连续属性的离散化	第49-50页
·离散化问题描述	第49页
·离散化方法	第49-50页
·信息约简	第50-57页
·信息约简的基本概念	第50-51页
·基于差别矩阵的属性约简方法	第51-53页
·二进制约简基本概念	第53-54页
·决策规则约简算法	第54-56页
·实例计算	第56-57页
·粗糙集与KNN的结合	第57-60页
·结束语	第60-61页
第六章基于粗糙集的KNN短信文本分类系统的设计与实现	第61-67页
·系统功能模块	第61-63页
·系统详细设计	第63-65页
·文本预处理模块	第63页
·特征向量集提取模块	第63-64页
·粗糙集约简模块	第64-65页
·分类系统模块	第65页
·实验评估	第65-66页
·本章小结	第66-67页
第七章总结与展望	第67-69页
·论文工作总结	第67-68页
·展望	第68-69页
致谢	第69-70页
参考文献	第70-73页
攻读学位期间的研究成果	第73页