首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于语义相似度的中文文本分类系统的研究与实现

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-15页
   ·课题意义第11页
   ·背景及现状第11-12页
   ·研究内容及问题提出第12-14页
   ·本文组织第14-15页
第2章 文本分类系统的建模与技术第15-35页
   ·文本分类系统总体结构的建模与设计第15-18页
     ·传统的文本分类系统模型第15-16页
     ·新系统的总体模型设计第16-17页
     ·文本分类系统的整体数据流程第17-18页
   ·文本系统分词模块设计第18-21页
     ·分词概述第18页
     ·分词算法第18-19页
     ·分词模型及流程第19-21页
   ·特征选择模块设计第21-25页
     ·特征选择的目的和意义第21页
     ·常用的特征选择方法第21-24页
     ·特征选择模块设计第24-25页
   ·文本表示模块的设计第25-26页
   ·文本分类模块的设计第26-29页
     ·常用的分类算法第26-28页
     ·自动分类模块的设计第28-29页
   ·特征选择的关键技术第29-35页
     ·词条输入数据库技术第29-31页
     ·数据库中的特征参数计算技术第31-35页
第3章 知网语义词典的建模和设计第35-50页
   ·知网的概述第35-38页
     ·知网简介第35页
     ·《知网》的系统结构第35-36页
     ·《知网》中的描述语言第36-38页
   ·知网相似度的计算第38-40页
     ·相似度基本算法第38页
     ·义原相似度的计算第38-39页
     ·实词相似度的计算第39-40页
   ·词典方法的构建第40-44页
     ·基于整词二分的词典机制第41-42页
     ·基于TRIE索引树的词典机制第42-43页
     ·基于逐字二分的词典机制第43-44页
   ·基于新的词典机制对知网词典进行构建第44-50页
     ·一种新的词典机制构建知网第44-47页
     ·知网语义模型的建模与技术第47-48页
     ·文件的语义处理技术第48-49页
     ·获取义原间的语义距离第49-50页
第4章 同义词林语义词典的建模与设计第50-56页
   ·同义词林扩展版概述第50-52页
     ·同义词林扩展版现状第50页
     ·词的分类第50-51页
     ·同义词林编码第51-52页
   ·同义词林的建模与技术第52-56页
     ·同义词林的词典建设第52-54页
     ·同义词林的语义相似处理技术第54-56页
第5章 SVM理论基础和算法技术第56-69页
   ·支持向量机的理论基础第56-58页
   ·SMO算法概述第58-63页
     ·SMO的算法两点解析第58-61页
     ·SMO偏值更新第61页
     ·SMO更新错误缓存第61-62页
     ·SMO工作集选择第62-63页
   ·SVMlight算法概述第63-64页
     ·工作集选择策略第63页
     ·求解 QP子问题第63页
     ·收缩第63-64页
     ·缓存第64页
   ·算法实现中的关键技术第64-69页
     ·准备工作第64-65页
     ·算法的流程第65-66页
     ·更新算法第66-67页
     ·收缩算法第67页
     ·活动集扩张第67-68页
     ·非活动集中违反KKT的查找第68-69页
第6章 实验结果与分析第69-73页
   ·系统所用的数据集第69页
   ·系统所用的评价指标第69-70页
   ·分类结果和分析第70-73页
第7章 结论第73-75页
   ·本文总结第73-74页
   ·进一步的工作第74-75页
参考文献第75-78页
攻读学位期间公开发表论文第78-79页
致谢第79-80页
研究生履历第80页

论文共80页,点击 下载论文
上一篇:无线通信衰落信道的实现
下一篇:基于小波阈值优化的遥感溢油SAR图像去噪研究