| 第一章 概述 | 第1-9页 |
| 第二章 知识点分类与多文档摘要 | 第9-28页 |
| ·绪论 | 第9-10页 |
| ·基于向量空间的文本分类 | 第10-15页 |
| ·文本分类的任务 | 第10页 |
| ·向量空间模型 | 第10-12页 |
| ·向量模型定义 | 第10-11页 |
| ·特征的权值表示 | 第11-12页 |
| ·识别方法 | 第12-15页 |
| ·KNN(K最近邻域法)方法 | 第12-13页 |
| ·SVM(支持向量机)方法 | 第13-14页 |
| ·模糊分类(Fuzzy Classification Method) | 第14-15页 |
| ·基于文本分类与链接分析的多文档摘要 | 第15-22页 |
| ·文档摘要任务 | 第15页 |
| ·多文档的数据结构 | 第15-16页 |
| ·文档摘要的算法 | 第16-18页 |
| ·快速文档摘要的基本思想 | 第16页 |
| ·文档标题的影响 | 第16-17页 |
| ·评估方法 | 第17-18页 |
| ·结合链接分析的多文档摘要 | 第18-19页 |
| ·根据互联网络结构的链接分析确定排序权重 | 第18页 |
| ·一般海量数据资料的排序权重 | 第18页 |
| ·排序权重的影响 | 第18-19页 |
| ·结合知识点分类的多文档摘要 | 第19-20页 |
| ·多文档摘要与知识点分类结合 | 第19页 |
| ·知识点分类的选择 | 第19-20页 |
| ·知识点分类权重的影响 | 第20页 |
| ·自动且完全的分类的多文档摘要: 一种新的数据挖掘角度 | 第20-22页 |
| ·自动且完全的分类 | 第20-21页 |
| ·涉及度(Degree of Relevance) | 第21-22页 |
| ·多文档自动与完全分类的摘要流程 | 第22页 |
| ·实验结果与讨论 | 第22-28页 |
| ·实验模型说明 | 第22-23页 |
| ·各种知识点分类方法的测试与比较 | 第23-25页 |
| ·KNN和SVM比较测试与结果讨论 | 第23-24页 |
| ·模糊分类测试结果与讨论 | 第24-25页 |
| ·多文档摘要测试与综合测试 | 第25-28页 |
| ·单文档摘要与标题的影响 | 第25-26页 |
| ·多文档摘要 | 第26页 |
| ·多文档自动与完全分类摘要的测试与结果 | 第26-28页 |
| 第三章 自定义网页搜索系统的实践 | 第28-60页 |
| ·绪论 | 第28-29页 |
| ·系统框架 | 第29-32页 |
| ·功能模块 | 第32-57页 |
| ·辅助功能模块 | 第33-35页 |
| ·文本切词器 | 第33页 |
| ·查询串分析器 | 第33-35页 |
| ·后台功能模块 | 第35-46页 |
| ·Windows窗体应用程序界面 | 第35-38页 |
| ·爬虫器 | 第38-40页 |
| ·排序器 | 第40-42页 |
| ·分类器 | 第42-45页 |
| ·监视器 | 第45-46页 |
| ·前台功能模块 | 第46-57页 |
| ·Servlet服务界面 | 第46-49页 |
| ·检索器 | 第49-51页 |
| ·报表器 | 第51-54页 |
| ·摘要器 | 第54-57页 |
| ·其他模块 | 第57页 |
| ·应用流程举例 | 第57-60页 |
| ·示例一 | 第57-58页 |
| ·示例二 | 第58页 |
| ·示例三 | 第58-60页 |
| 第四章 网页搜索中对自然语义分析的探索 | 第60-72页 |
| ·概述 | 第60页 |
| ·隐含语义检索(LSI) | 第60-65页 |
| ·LSI的定义 | 第60-64页 |
| ·Term-Document矩阵的主成分分析 | 第60-61页 |
| ·文档(Document)匹配 | 第61-63页 |
| ·索引项(Term)匹配 | 第63页 |
| ·概念空间 | 第63-64页 |
| ·LSI在互连网页搜索的实际应用 | 第64-65页 |
| ·词汇-隐含概念-文档学习机制 | 第65-70页 |
| ·WordNet概述 | 第65-67页 |
| ·Word-Concept-Document概率模型与EM算法 | 第67-69页 |
| ·缩小参数空间与优化初始条件 | 第69-70页 |
| ·互联网知识体系的应用框架 | 第70-72页 |
| 第五章 总结与展望 | 第72-73页 |
| 参考文献 | 第73-75页 |
| 攻读硕士学位期间公开发表(录用)的论文和参与的项目 | 第75-76页 |
| 致谢 | 第76页 |