| 摘要 | 第1-7页 |
| ABSTRACT | 第7-13页 |
| 1 绪论 | 第13-31页 |
| ·论文研究的背景 | 第13-14页 |
| ·论文研究的意义 | 第14-16页 |
| ·文本知识管理系统常用的模型及研究进展 | 第16-20页 |
| ·经典布尔模型(Classical Boolean Model) | 第16-17页 |
| ·向量空间模型(Vector Space Model) | 第17-18页 |
| ·扩展布尔模型(Extended Boolean model) | 第18-19页 |
| ·概率模型( Probabilistic Model) | 第19页 |
| ·统计语言模型(Statistical Language Modeling) | 第19-20页 |
| ·中文分词及国内外研究进展 | 第20-24页 |
| ·中文分词的难点 | 第21页 |
| ·基于词典匹配的分词法 | 第21-22页 |
| ·基于语料统计的统计分词法 | 第22-23页 |
| ·规则和统计结合的方法 | 第23页 |
| ·语义分词法 | 第23-24页 |
| ·文本分类模型及国内外研究进展 | 第24-29页 |
| ·k 最近邻模型 | 第24-25页 |
| ·支持向量机模型 | 第25-26页 |
| ·朴素贝叶斯分类器模型 | 第26页 |
| ·决策树模型 | 第26-27页 |
| ·神经网络模型 | 第27-28页 |
| ·单层文本分类模型的小结和评估 | 第28页 |
| ·层次文本分类模型 | 第28-29页 |
| ·本论文研究的内容 | 第29-31页 |
| 2 自适应中文分词算法研究 | 第31-49页 |
| ·文本知识管理系统对中文分词的要求 | 第31-32页 |
| ·准确性 | 第31页 |
| ·高效性 | 第31页 |
| ·适用性 | 第31-32页 |
| ·中文分词方法的理论基础 | 第32-35页 |
| ·字典匹配中文分词模型 | 第32-33页 |
| ·互信息原理 | 第33页 |
| ·n 元(N-gram)统计模型原理 | 第33-34页 |
| ·N-gram 方法影响分词性能的简单分析 | 第34-35页 |
| ·分词精度影响检索性能的分析 | 第35页 |
| ·SAWSA 自适应中文分词算法 | 第35-42页 |
| ·算法的基本流程图 | 第35-36页 |
| ·算法的预处理方法 | 第36-38页 |
| ·子句2-gram 分词算法 | 第38-40页 |
| ·算法的关键问题 | 第40-41页 |
| ·算法的后处理规则 | 第41-42页 |
| ·SAWSA 的实验与分析 | 第42-49页 |
| ·测试的分词结果举例 | 第42-44页 |
| ·算法的分词正确率 | 第44页 |
| ·算法的适应性测试 | 第44-46页 |
| ·不同最大句长和词长对分词算法的影响 | 第46-48页 |
| ·基于SAWSA 的文本分类实验 | 第48-49页 |
| 3 一种降维的近似支持向量机分类算法 | 第49-69页 |
| ·理论基础 | 第49-56页 |
| ·文本分类问题的描述 | 第49页 |
| ·单标号文本分类与多标号文本分类 | 第49页 |
| ·类别中心分类与文本中心分类 | 第49-50页 |
| ·分类模型的评估 | 第50-51页 |
| ·评估指标 | 第51-53页 |
| ·SVM 分类原理 | 第53-56页 |
| ·近似支持向量机 | 第56-58页 |
| ·基于降维的近似支持向量机学习算法 | 第58-62页 |
| ·等式约束问题降维的K-T 条件 | 第58-59页 |
| ·线性等式约束的二次规划问题 | 第59-61页 |
| ·基于降维的近似支持向量机学习算法 | 第61-62页 |
| ·降维近似支持向量机的文本分类实验 | 第62-69页 |
| ·实验的文本特征构建方法选择 | 第62-64页 |
| ·实验的文本特征选择方法 | 第64-65页 |
| ·实验环境 | 第65-66页 |
| ·实验结果分析 | 第66-69页 |
| 4 基于本体的层次文本分类算法 | 第69-102页 |
| ·本体论及其研究现状 | 第70-79页 |
| ·本体的定义及相关概念 | 第70页 |
| ·本体的描述语言 | 第70-71页 |
| ·描述逻辑 | 第71-74页 |
| ·本体的构建方法 | 第74-77页 |
| ·本体的开发工具 | 第77-78页 |
| ·本体的应用 | 第78-79页 |
| ·层次文本分类及其方法 | 第79-82页 |
| ·层次文本分类概念及其与单层文本分类的比较 | 第80-81页 |
| ·层次文本分类方法概述 | 第81页 |
| ·Shrinkage 层次文本分类算法 | 第81-82页 |
| ·基于本体的层次文本分类算法 | 第82-86页 |
| ·知识本体中概念间的相似度计算 | 第82-84页 |
| ·算法描述 | 第84-85页 |
| ·算法中构建本体候选特征词的选择方法 | 第85-86页 |
| ·基于本体的层次文本分类算法实验 | 第86-102页 |
| ·实验环境 | 第86页 |
| ·实验中的本体概念选择 | 第86-96页 |
| ·顶层文本分类实验结果及分析 | 第96-99页 |
| ·层次文本分类实验结果及分析 | 第99-102页 |
| 5 分布式文本知识管理系统EKNOW | 第102-110页 |
| ·文本知识管理系统EKNOW | 第102-105页 |
| ·系统框架 | 第102-104页 |
| ·技术路线 | 第104页 |
| ·全覆盖的文本知识管理系统 | 第104-105页 |
| ·P2P 网络模型分析 | 第105-107页 |
| ·纯分散式P2P 网络 | 第105页 |
| ·混合P2P 网络 | 第105-106页 |
| ·Super-P2P 网络 | 第106-107页 |
| ·基于SUPER-P2P 结构的分布式文本知识管理模型 | 第107-110页 |
| ·Super-P2P 分布式文本知识管理系统结构 | 第107-108页 |
| ·Super-P2P 分布式知识管理系统的文本知识俘获机制 | 第108-110页 |
| 6 总结与展望 | 第110-112页 |
| ·论文的主要贡献与创新 | 第110-111页 |
| ·下一步的研究工作 | 第111-112页 |
| 致谢 | 第112-114页 |
| 参考文献 | 第114-122页 |
| 附录 | 第122-124页 |
| A. 作者攻读博士学位期间发表或录用的论文 | 第122页 |
| B. 作者在攻读博士学位期间主持和参与的科研项目 | 第122-124页 |