面向分布式文本知识管理的中文分词与文本分类研究

摘要	第1-7页
ABSTRACT	第7-13页
1 绪论	第13-31页
·论文研究的背景	第13-14页
·论文研究的意义	第14-16页
·文本知识管理系统常用的模型及研究进展	第16-20页
·经典布尔模型（Classical Boolean Model）	第16-17页
·向量空间模型（Vector Space Model）	第17-18页
·扩展布尔模型（Extended Boolean model）	第18-19页
·概率模型（ Probabilistic Model）	第19页
·统计语言模型（Statistical Language Modeling）	第19-20页
·中文分词及国内外研究进展	第20-24页
·中文分词的难点	第21页
·基于词典匹配的分词法	第21-22页
·基于语料统计的统计分词法	第22-23页
·规则和统计结合的方法	第23页
·语义分词法	第23-24页
·文本分类模型及国内外研究进展	第24-29页
·k 最近邻模型	第24-25页
·支持向量机模型	第25-26页
·朴素贝叶斯分类器模型	第26页
·决策树模型	第26-27页
·神经网络模型	第27-28页
·单层文本分类模型的小结和评估	第28页
·层次文本分类模型	第28-29页
·本论文研究的内容	第29-31页
2 自适应中文分词算法研究	第31-49页
·文本知识管理系统对中文分词的要求	第31-32页
·准确性	第31页
·高效性	第31页
·适用性	第31-32页
·中文分词方法的理论基础	第32-35页
·字典匹配中文分词模型	第32-33页
·互信息原理	第33页
·n 元(N-gram)统计模型原理	第33-34页
·N-gram 方法影响分词性能的简单分析	第34-35页
·分词精度影响检索性能的分析	第35页
·SAWSA 自适应中文分词算法	第35-42页
·算法的基本流程图	第35-36页
·算法的预处理方法	第36-38页
·子句2-gram 分词算法	第38-40页
·算法的关键问题	第40-41页
·算法的后处理规则	第41-42页
·SAWSA 的实验与分析	第42-49页
·测试的分词结果举例	第42-44页
·算法的分词正确率	第44页
·算法的适应性测试	第44-46页
·不同最大句长和词长对分词算法的影响	第46-48页
·基于SAWSA 的文本分类实验	第48-49页
3 一种降维的近似支持向量机分类算法	第49-69页
·理论基础	第49-56页
·文本分类问题的描述	第49页
·单标号文本分类与多标号文本分类	第49页
·类别中心分类与文本中心分类	第49-50页
·分类模型的评估	第50-51页
·评估指标	第51-53页
·SVM 分类原理	第53-56页
·近似支持向量机	第56-58页
·基于降维的近似支持向量机学习算法	第58-62页
·等式约束问题降维的K-T 条件	第58-59页
·线性等式约束的二次规划问题	第59-61页
·基于降维的近似支持向量机学习算法	第61-62页
·降维近似支持向量机的文本分类实验	第62-69页
·实验的文本特征构建方法选择	第62-64页
·实验的文本特征选择方法	第64-65页
·实验环境	第65-66页
·实验结果分析	第66-69页
4 基于本体的层次文本分类算法	第69-102页
·本体论及其研究现状	第70-79页
·本体的定义及相关概念	第70页
·本体的描述语言	第70-71页
·描述逻辑	第71-74页
·本体的构建方法	第74-77页
·本体的开发工具	第77-78页
·本体的应用	第78-79页
·层次文本分类及其方法	第79-82页
·层次文本分类概念及其与单层文本分类的比较	第80-81页
·层次文本分类方法概述	第81页
·Shrinkage 层次文本分类算法	第81-82页
·基于本体的层次文本分类算法	第82-86页
·知识本体中概念间的相似度计算	第82-84页
·算法描述	第84-85页
·算法中构建本体候选特征词的选择方法	第85-86页
·基于本体的层次文本分类算法实验	第86-102页
·实验环境	第86页
·实验中的本体概念选择	第86-96页
·顶层文本分类实验结果及分析	第96-99页
·层次文本分类实验结果及分析	第99-102页
5 分布式文本知识管理系统EKNOW	第102-110页
·文本知识管理系统EKNOW	第102-105页
·系统框架	第102-104页
·技术路线	第104页
·全覆盖的文本知识管理系统	第104-105页
·P2P 网络模型分析	第105-107页
·纯分散式P2P 网络	第105页
·混合P2P 网络	第105-106页
·Super-P2P 网络	第106-107页
·基于SUPER-P2P 结构的分布式文本知识管理模型	第107-110页
·Super-P2P 分布式文本知识管理系统结构	第107-108页
·Super-P2P 分布式知识管理系统的文本知识俘获机制	第108-110页
6 总结与展望	第110-112页
·论文的主要贡献与创新	第110-111页
·下一步的研究工作	第111-112页
致谢	第112-114页
参考文献	第114-122页
附录	第122-124页
A. 作者攻读博士学位期间发表或录用的论文	第122页
B. 作者在攻读博士学位期间主持和参与的科研项目	第122-124页