互联网页文字信息分析技术研究与应用

第一章概述	第1-9页
第二章知识点分类与多文档摘要	第9-28页
·绪论	第9-10页
·基于向量空间的文本分类	第10-15页
·文本分类的任务	第10页
·向量空间模型	第10-12页
·向量模型定义	第10-11页
·特征的权值表示	第11-12页
·识别方法	第12-15页
·KNN(K最近邻域法)方法	第12-13页
·SVM(支持向量机)方法	第13-14页
·模糊分类(Fuzzy Classification Method)	第14-15页
·基于文本分类与链接分析的多文档摘要	第15-22页
·文档摘要任务	第15页
·多文档的数据结构	第15-16页
·文档摘要的算法	第16-18页
·快速文档摘要的基本思想	第16页
·文档标题的影响	第16-17页
·评估方法	第17-18页
·结合链接分析的多文档摘要	第18-19页
·根据互联网络结构的链接分析确定排序权重	第18页
·一般海量数据资料的排序权重	第18页
·排序权重的影响	第18-19页
·结合知识点分类的多文档摘要	第19-20页
·多文档摘要与知识点分类结合	第19页
·知识点分类的选择	第19-20页
·知识点分类权重的影响	第20页
·自动且完全的分类的多文档摘要: 一种新的数据挖掘角度	第20-22页
·自动且完全的分类	第20-21页
·涉及度(Degree of Relevance)	第21-22页
·多文档自动与完全分类的摘要流程	第22页
·实验结果与讨论	第22-28页
·实验模型说明	第22-23页
·各种知识点分类方法的测试与比较	第23-25页
·KNN和SVM比较测试与结果讨论	第23-24页
·模糊分类测试结果与讨论	第24-25页
·多文档摘要测试与综合测试	第25-28页
·单文档摘要与标题的影响	第25-26页
·多文档摘要	第26页
·多文档自动与完全分类摘要的测试与结果	第26-28页
第三章自定义网页搜索系统的实践	第28-60页
·绪论	第28-29页
·系统框架	第29-32页
·功能模块	第32-57页
·辅助功能模块	第33-35页
·文本切词器	第33页
·查询串分析器	第33-35页
·后台功能模块	第35-46页
·Windows窗体应用程序界面	第35-38页
·爬虫器	第38-40页
·排序器	第40-42页
·分类器	第42-45页
·监视器	第45-46页
·前台功能模块	第46-57页
·Servlet服务界面	第46-49页
·检索器	第49-51页
·报表器	第51-54页
·摘要器	第54-57页
·其他模块	第57页
·应用流程举例	第57-60页
·示例一	第57-58页
·示例二	第58页
·示例三	第58-60页
第四章网页搜索中对自然语义分析的探索	第60-72页
·概述	第60页
·隐含语义检索(LSI)	第60-65页
·LSI的定义	第60-64页
·Term-Document矩阵的主成分分析	第60-61页
·文档(Document)匹配	第61-63页
·索引项(Term)匹配	第63页
·概念空间	第63-64页
·LSI在互连网页搜索的实际应用	第64-65页
·词汇-隐含概念-文档学习机制	第65-70页
·WordNet概述	第65-67页
·Word-Concept-Document概率模型与EM算法	第67-69页
·缩小参数空间与优化初始条件	第69-70页
·互联网知识体系的应用框架	第70-72页
第五章总结与展望	第72-73页
参考文献	第73-75页
攻读硕士学位期间公开发表(录用)的论文和参与的项目	第75-76页
致谢	第76页