第一章 概述 | 第1-9页 |
第二章 知识点分类与多文档摘要 | 第9-28页 |
·绪论 | 第9-10页 |
·基于向量空间的文本分类 | 第10-15页 |
·文本分类的任务 | 第10页 |
·向量空间模型 | 第10-12页 |
·向量模型定义 | 第10-11页 |
·特征的权值表示 | 第11-12页 |
·识别方法 | 第12-15页 |
·KNN(K最近邻域法)方法 | 第12-13页 |
·SVM(支持向量机)方法 | 第13-14页 |
·模糊分类(Fuzzy Classification Method) | 第14-15页 |
·基于文本分类与链接分析的多文档摘要 | 第15-22页 |
·文档摘要任务 | 第15页 |
·多文档的数据结构 | 第15-16页 |
·文档摘要的算法 | 第16-18页 |
·快速文档摘要的基本思想 | 第16页 |
·文档标题的影响 | 第16-17页 |
·评估方法 | 第17-18页 |
·结合链接分析的多文档摘要 | 第18-19页 |
·根据互联网络结构的链接分析确定排序权重 | 第18页 |
·一般海量数据资料的排序权重 | 第18页 |
·排序权重的影响 | 第18-19页 |
·结合知识点分类的多文档摘要 | 第19-20页 |
·多文档摘要与知识点分类结合 | 第19页 |
·知识点分类的选择 | 第19-20页 |
·知识点分类权重的影响 | 第20页 |
·自动且完全的分类的多文档摘要: 一种新的数据挖掘角度 | 第20-22页 |
·自动且完全的分类 | 第20-21页 |
·涉及度(Degree of Relevance) | 第21-22页 |
·多文档自动与完全分类的摘要流程 | 第22页 |
·实验结果与讨论 | 第22-28页 |
·实验模型说明 | 第22-23页 |
·各种知识点分类方法的测试与比较 | 第23-25页 |
·KNN和SVM比较测试与结果讨论 | 第23-24页 |
·模糊分类测试结果与讨论 | 第24-25页 |
·多文档摘要测试与综合测试 | 第25-28页 |
·单文档摘要与标题的影响 | 第25-26页 |
·多文档摘要 | 第26页 |
·多文档自动与完全分类摘要的测试与结果 | 第26-28页 |
第三章 自定义网页搜索系统的实践 | 第28-60页 |
·绪论 | 第28-29页 |
·系统框架 | 第29-32页 |
·功能模块 | 第32-57页 |
·辅助功能模块 | 第33-35页 |
·文本切词器 | 第33页 |
·查询串分析器 | 第33-35页 |
·后台功能模块 | 第35-46页 |
·Windows窗体应用程序界面 | 第35-38页 |
·爬虫器 | 第38-40页 |
·排序器 | 第40-42页 |
·分类器 | 第42-45页 |
·监视器 | 第45-46页 |
·前台功能模块 | 第46-57页 |
·Servlet服务界面 | 第46-49页 |
·检索器 | 第49-51页 |
·报表器 | 第51-54页 |
·摘要器 | 第54-57页 |
·其他模块 | 第57页 |
·应用流程举例 | 第57-60页 |
·示例一 | 第57-58页 |
·示例二 | 第58页 |
·示例三 | 第58-60页 |
第四章 网页搜索中对自然语义分析的探索 | 第60-72页 |
·概述 | 第60页 |
·隐含语义检索(LSI) | 第60-65页 |
·LSI的定义 | 第60-64页 |
·Term-Document矩阵的主成分分析 | 第60-61页 |
·文档(Document)匹配 | 第61-63页 |
·索引项(Term)匹配 | 第63页 |
·概念空间 | 第63-64页 |
·LSI在互连网页搜索的实际应用 | 第64-65页 |
·词汇-隐含概念-文档学习机制 | 第65-70页 |
·WordNet概述 | 第65-67页 |
·Word-Concept-Document概率模型与EM算法 | 第67-69页 |
·缩小参数空间与优化初始条件 | 第69-70页 |
·互联网知识体系的应用框架 | 第70-72页 |
第五章 总结与展望 | 第72-73页 |
参考文献 | 第73-75页 |
攻读硕士学位期间公开发表(录用)的论文和参与的项目 | 第75-76页 |
致谢 | 第76页 |