文本分类技术在综合风险元搜索引擎中的研究与实现

摘要	第1-4页
ABSTRACT	第4-6页
目录	第6-8页
第一章绪论	第8-16页
·研究背景	第8页
·选题背景及意义	第8-10页
·文本分类问题概述	第10-13页
·文本分类的发展过程	第10-11页
·文本分类的研究热点	第11页
·文本分类的基本流程	第11-13页
·本文的研究内容	第13-14页
·本文的组织结构	第14-16页
第二章文本预处理	第16-21页
·Web文档转换	第16-17页
·Web文本预处理	第17-21页
·Web文档标记加权	第17-18页
·中文分词	第18-21页
第三章文本特征权重概念与计算	第21-32页
·文本的向量标示	第21-22页
·权重函数构造	第22-24页
·布尔权重	第22-23页
·词频权重	第23页
·熵权重	第23页
·TF*IDF权重	第23-24页
·对经典TF*IDF权重计算方法的改进	第24-25页
·实验结果与分析	第25-32页
·选取数据集	第25-26页
·单一文本权重值计算结果	第26-28页
·语料库分类性能结果	第28-32页
第四章文本特征约简	第32-41页
·维数约简的途径	第32-33页
·常用的维数约简方法	第33-37页
·文档频率	第33-34页
·信息增益	第34-35页
·交叉熵	第35页
·互信息	第35-36页
·x2统计量	第36-37页
·基于特征类别区分度的特征选择方法	第37-38页
·属性约简实验结果与分析	第38-41页
·单一文档的属性约简	第38-40页
·测试集的属性约简结果	第40-41页
第五章基于KNN-BAGGING的文本分类器设计	第41-53页
·当前文本分类器构造算法概述	第41-45页
·简单向量距离分类	第41-42页
·朴素贝叶斯法	第42页
·支持向量机	第42-44页
·决策树分类算法	第44-45页
·KNN算法	第45页
·综合分类算法介绍	第45-46页
·BAGGING算法基本思想	第46-47页
·KNN与BAGGING的结合算法	第47-49页
·KNN与BAGGING结合的理由	第47-48页
·具体算法描述	第48-49页
·实验结果与分析	第49-53页
·KNN-BAGGING算法中j，T值的确定	第49-51页
·风险信息的实验结果	第51-53页
第六章综合风险元搜索引擎的设计与实现	第53-61页
·元搜索引擎概述	第53-55页
·当前网络搜索现状	第53-54页
·元搜索引擎的概念	第54-55页
·系统总体框架	第55-58页
·系统模块设计	第55-57页
·元搜索引擎的设计	第57-58页
·系统开发与运行环境	第58-59页
·开发环境	第58-59页
·运行环境	第59页
·系统运行截图	第59-61页
第七章总结与展望	第61-63页
·本文工作总结	第61页
·进一步的工作	第61-63页
致谢	第63-64页
参考文献	第64-68页
攻读硕士学位期间发表的论文	第68页
在学习期间参加的科研项目	第68页