首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

文本分类技术在综合风险元搜索引擎中的研究与实现

摘要第1-4页
ABSTRACT第4-6页
目录第6-8页
第一章 绪论第8-16页
   ·研究背景第8页
   ·选题背景及意义第8-10页
   ·文本分类问题概述第10-13页
     ·文本分类的发展过程第10-11页
     ·文本分类的研究热点第11页
     ·文本分类的基本流程第11-13页
   ·本文的研究内容第13-14页
   ·本文的组织结构第14-16页
第二章 文本预处理第16-21页
   ·Web文档转换第16-17页
   ·Web文本预处理第17-21页
     ·Web文档标记加权第17-18页
     ·中文分词第18-21页
第三章 文本特征权重概念与计算第21-32页
   ·文本的向量标示第21-22页
   ·权重函数构造第22-24页
     ·布尔权重第22-23页
     ·词频权重第23页
     ·熵权重第23页
     ·TF*IDF权重第23-24页
   ·对经典TF*IDF权重计算方法的改进第24-25页
   ·实验结果与分析第25-32页
     ·选取数据集第25-26页
     ·单一文本权重值计算结果第26-28页
     ·语料库分类性能结果第28-32页
第四章 文本特征约简第32-41页
   ·维数约简的途径第32-33页
   ·常用的维数约简方法第33-37页
     ·文档频率第33-34页
     ·信息增益第34-35页
     ·交叉熵第35页
     ·互信息第35-36页
     ·x2统计量第36-37页
   ·基于特征类别区分度的特征选择方法第37-38页
   ·属性约简实验结果与分析第38-41页
     ·单一文档的属性约简第38-40页
     ·测试集的属性约简结果第40-41页
第五章 基于KNN-BAGGING的文本分类器设计第41-53页
   ·当前文本分类器构造算法概述第41-45页
     ·简单向量距离分类第41-42页
     ·朴素贝叶斯法第42页
     ·支持向量机第42-44页
     ·决策树分类算法第44-45页
     ·KNN算法第45页
   ·综合分类算法介绍第45-46页
   ·BAGGING算法基本思想第46-47页
   ·KNN与BAGGING的结合算法第47-49页
     ·KNN与BAGGING结合的理由第47-48页
     ·具体算法描述第48-49页
   ·实验结果与分析第49-53页
     ·KNN-BAGGING算法中j,T值的确定第49-51页
     ·风险信息的实验结果第51-53页
第六章 综合风险元搜索引擎的设计与实现第53-61页
   ·元搜索引擎概述第53-55页
     ·当前网络搜索现状第53-54页
     ·元搜索引擎的概念第54-55页
   ·系统总体框架第55-58页
     ·系统模块设计第55-57页
     ·元搜索引擎的设计第57-58页
   ·系统开发与运行环境第58-59页
     ·开发环境第58-59页
     ·运行环境第59页
   ·系统运行截图第59-61页
第七章 总结与展望第61-63页
   ·本文工作总结第61页
   ·进一步的工作第61-63页
致谢第63-64页
参考文献第64-68页
攻读硕士学位期间发表的论文第68页
在学习期间参加的科研项目第68页

论文共68页,点击 下载论文
上一篇:面向中小企业的多项目管理系统研究
下一篇:基于医学体数据场的大脑皮层可视化技术研究及其应用