首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向分布式文本知识管理的中文分词与文本分类研究

摘要第1-7页
ABSTRACT第7-13页
1 绪论第13-31页
   ·论文研究的背景第13-14页
   ·论文研究的意义第14-16页
   ·文本知识管理系统常用的模型及研究进展第16-20页
     ·经典布尔模型(Classical Boolean Model)第16-17页
     ·向量空间模型(Vector Space Model)第17-18页
     ·扩展布尔模型(Extended Boolean model)第18-19页
     ·概率模型( Probabilistic Model)第19页
     ·统计语言模型(Statistical Language Modeling)第19-20页
   ·中文分词及国内外研究进展第20-24页
     ·中文分词的难点第21页
     ·基于词典匹配的分词法第21-22页
     ·基于语料统计的统计分词法第22-23页
     ·规则和统计结合的方法第23页
     ·语义分词法第23-24页
   ·文本分类模型及国内外研究进展第24-29页
     ·k 最近邻模型第24-25页
     ·支持向量机模型第25-26页
     ·朴素贝叶斯分类器模型第26页
     ·决策树模型第26-27页
     ·神经网络模型第27-28页
     ·单层文本分类模型的小结和评估第28页
     ·层次文本分类模型第28-29页
   ·本论文研究的内容第29-31页
2 自适应中文分词算法研究第31-49页
   ·文本知识管理系统对中文分词的要求第31-32页
     ·准确性第31页
     ·高效性第31页
     ·适用性第31-32页
   ·中文分词方法的理论基础第32-35页
     ·字典匹配中文分词模型第32-33页
     ·互信息原理第33页
     ·n 元(N-gram)统计模型原理第33-34页
     ·N-gram 方法影响分词性能的简单分析第34-35页
     ·分词精度影响检索性能的分析第35页
   ·SAWSA 自适应中文分词算法第35-42页
     ·算法的基本流程图第35-36页
     ·算法的预处理方法第36-38页
     ·子句2-gram 分词算法第38-40页
     ·算法的关键问题第40-41页
     ·算法的后处理规则第41-42页
   ·SAWSA 的实验与分析第42-49页
     ·测试的分词结果举例第42-44页
     ·算法的分词正确率第44页
     ·算法的适应性测试第44-46页
     ·不同最大句长和词长对分词算法的影响第46-48页
     ·基于SAWSA 的文本分类实验第48-49页
3 一种降维的近似支持向量机分类算法第49-69页
   ·理论基础第49-56页
     ·文本分类问题的描述第49页
     ·单标号文本分类与多标号文本分类第49页
     ·类别中心分类与文本中心分类第49-50页
     ·分类模型的评估第50-51页
     ·评估指标第51-53页
     ·SVM 分类原理第53-56页
   ·近似支持向量机第56-58页
   ·基于降维的近似支持向量机学习算法第58-62页
     ·等式约束问题降维的K-T 条件第58-59页
     ·线性等式约束的二次规划问题第59-61页
     ·基于降维的近似支持向量机学习算法第61-62页
   ·降维近似支持向量机的文本分类实验第62-69页
     ·实验的文本特征构建方法选择第62-64页
     ·实验的文本特征选择方法第64-65页
     ·实验环境第65-66页
     ·实验结果分析第66-69页
4 基于本体的层次文本分类算法第69-102页
   ·本体论及其研究现状第70-79页
     ·本体的定义及相关概念第70页
     ·本体的描述语言第70-71页
     ·描述逻辑第71-74页
     ·本体的构建方法第74-77页
     ·本体的开发工具第77-78页
     ·本体的应用第78-79页
   ·层次文本分类及其方法第79-82页
     ·层次文本分类概念及其与单层文本分类的比较第80-81页
     ·层次文本分类方法概述第81页
     ·Shrinkage 层次文本分类算法第81-82页
   ·基于本体的层次文本分类算法第82-86页
     ·知识本体中概念间的相似度计算第82-84页
     ·算法描述第84-85页
     ·算法中构建本体候选特征词的选择方法第85-86页
   ·基于本体的层次文本分类算法实验第86-102页
     ·实验环境第86页
     ·实验中的本体概念选择第86-96页
     ·顶层文本分类实验结果及分析第96-99页
     ·层次文本分类实验结果及分析第99-102页
5 分布式文本知识管理系统EKNOW第102-110页
   ·文本知识管理系统EKNOW第102-105页
     ·系统框架第102-104页
     ·技术路线第104页
     ·全覆盖的文本知识管理系统第104-105页
   ·P2P 网络模型分析第105-107页
     ·纯分散式P2P 网络第105页
     ·混合P2P 网络第105-106页
     ·Super-P2P 网络第106-107页
   ·基于SUPER-P2P 结构的分布式文本知识管理模型第107-110页
     ·Super-P2P 分布式文本知识管理系统结构第107-108页
     ·Super-P2P 分布式知识管理系统的文本知识俘获机制第108-110页
6 总结与展望第110-112页
   ·论文的主要贡献与创新第110-111页
   ·下一步的研究工作第111-112页
致谢第112-114页
参考文献第114-122页
附录第122-124页
 A. 作者攻读博士学位期间发表或录用的论文第122页
 B. 作者在攻读博士学位期间主持和参与的科研项目第122-124页

论文共124页,点击 下载论文
上一篇:基于混沌理论的信息安全加密系统的应用研究
下一篇:面向大规模定制的扩展制造执行系统及其关键技术研究