首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间模型的中文文本分类技术研究

摘要第1-4页
Abstract第4-7页
前言第7-9页
第一章 文本自动分类概述第9-14页
   ·文本自动分类研究的背景和意义第9页
   ·问题描述第9-10页
     ·文本分类第9-10页
     ·文本自动分类的两种类型第10页
     ·两种分类模型第10页
   ·基于统计的中文文本自动分类第10-13页
   ·本文所做的工作第13-14页
第二章 文本的结构化表示第14-20页
   ·向量空间模型第14-16页
     ·向量空间模型的基本概念第14页
     ·向量间的相似度第14-16页
   ·特征项加权第16-18页
     ·加权算法概述第16-17页
     ·加权算法改进第17-18页
   ·特征项的选择第18-19页
   ·关于VSM 的讨论第19-20页
第三章 特征选择与分类算法第20-27页
   ·特征选择第20-25页
     ·特征项的获取第20-22页
     ·特征选择方法第22-24页
     ·一种新的特征选择方法第24-25页
   ·分类算法研究第25-27页
     ·贝叶斯算法第25-26页
     ·k-近邻算法第26页
     ·类中心分类算法第26-27页
第四章 分类器的学习算法第27-34页
   ·EM 文本分类学习算法第27-28页
     ·EM 算法第27页
     ·EM 文本分类学习算法第27-28页
   ·非监督的聚类算法第28-30页
     ·非监督聚类算法的特点第28页
     ·C-均值算法第28-29页
     ·ISODATA 算法第29-30页
     ·动态聚类算法存在的问题第30页
   ·迭代TFIDF 算法第30-34页
     ·TFIDF 算法第30-31页
     ·迭代TFIDF 算法第31-32页
     ·迭代TFIDF 算法存在的问题第32页
     ·主动学习的迭代TFIDF 算法第32-34页
第五章 系统设计与实验测试第34-44页
   ·中文文本分类实验系统第34-37页
     ·系统的体系结构第34页
     ·系统的实现第34-37页
   ·实验测试第37-44页
     ·分类结果的评价方法第37-38页
     ·测试语料第38页
     ·特征选择及加权算法测试第38-41页
     ·学习算法测试第41-44页
结束语第44-45页
致谢第45-46页
参考文献第46-48页
攻读硕士学位期间发表的论文第48-49页
中文详细摘要第49-54页

论文共54页,点击 下载论文
上一篇:袖珍公园的发展与规划设计对策的研究
下一篇:基于VxWorks的水下机器人声视觉软件系统关键技术研究