基于语义相似度的中文文本分类系统的研究与实现

摘要	第1-6页
Abstract	第6-11页
第1章绪论	第11-15页
·课题意义	第11页
·背景及现状	第11-12页
·研究内容及问题提出	第12-14页
·本文组织	第14-15页
第2章文本分类系统的建模与技术	第15-35页
·文本分类系统总体结构的建模与设计	第15-18页
·传统的文本分类系统模型	第15-16页
·新系统的总体模型设计	第16-17页
·文本分类系统的整体数据流程	第17-18页
·文本系统分词模块设计	第18-21页
·分词概述	第18页
·分词算法	第18-19页
·分词模型及流程	第19-21页
·特征选择模块设计	第21-25页
·特征选择的目的和意义	第21页
·常用的特征选择方法	第21-24页
·特征选择模块设计	第24-25页
·文本表示模块的设计	第25-26页
·文本分类模块的设计	第26-29页
·常用的分类算法	第26-28页
·自动分类模块的设计	第28-29页
·特征选择的关键技术	第29-35页
·词条输入数据库技术	第29-31页
·数据库中的特征参数计算技术	第31-35页
第3章知网语义词典的建模和设计	第35-50页
·知网的概述	第35-38页
·知网简介	第35页
·《知网》的系统结构	第35-36页
·《知网》中的描述语言	第36-38页
·知网相似度的计算	第38-40页
·相似度基本算法	第38页
·义原相似度的计算	第38-39页
·实词相似度的计算	第39-40页
·词典方法的构建	第40-44页
·基于整词二分的词典机制	第41-42页
·基于TRIE索引树的词典机制	第42-43页
·基于逐字二分的词典机制	第43-44页
·基于新的词典机制对知网词典进行构建	第44-50页
·一种新的词典机制构建知网	第44-47页
·知网语义模型的建模与技术	第47-48页
·文件的语义处理技术	第48-49页
·获取义原间的语义距离	第49-50页
第4章同义词林语义词典的建模与设计	第50-56页
·同义词林扩展版概述	第50-52页
·同义词林扩展版现状	第50页
·词的分类	第50-51页
·同义词林编码	第51-52页
·同义词林的建模与技术	第52-56页
·同义词林的词典建设	第52-54页
·同义词林的语义相似处理技术	第54-56页
第5章 SVM理论基础和算法技术	第56-69页
·支持向量机的理论基础	第56-58页
·SMO算法概述	第58-63页
·SMO的算法两点解析	第58-61页
·SMO偏值更新	第61页
·SMO更新错误缓存	第61-62页
·SMO工作集选择	第62-63页
·SVMlight算法概述	第63-64页
·工作集选择策略	第63页
·求解 QP子问题	第63页
·收缩	第63-64页
·缓存	第64页
·算法实现中的关键技术	第64-69页
·准备工作	第64-65页
·算法的流程	第65-66页
·更新算法	第66-67页
·收缩算法	第67页
·活动集扩张	第67-68页
·非活动集中违反KKT的查找	第68-69页
第6章实验结果与分析	第69-73页
·系统所用的数据集	第69页
·系统所用的评价指标	第69-70页
·分类结果和分析	第70-73页
第7章结论	第73-75页
·本文总结	第73-74页
·进一步的工作	第74-75页
参考文献	第75-78页
攻读学位期间公开发表论文	第78-79页
致谢	第79-80页
研究生履历	第80页