中文搜索引擎中的文档特征提取研究

第一章绪论	第1-12页
·Internet发展现状	第6页
·搜索引擎发展历史	第6-7页
·搜索引擎的基本原理	第7-8页
·搜索引擎的分类	第8-9页
·基于目录结构的信息检索系统	第8页
·基于关键词检索的信息检索系统	第8-9页
·中文搜索引擎发展现状	第9-10页
·研究的动机	第10-11页
·本文的主要工作及内容安排	第11-12页
第二章词语相关度的计算	第12-18页
·知网简介	第12-13页
·基于HowNet的词语相关度计算	第13-17页
·义原距离计算	第13-15页
·义原相似度计算	第15页
·词语相似度计算	第15-16页
·词语相关度计算	第16页
·相关词语的联想搜索	第16-17页
·小结	第17-18页
第三章中文自动分词	第18-26页
·中文分词算法存在的困难	第18-19页
·常见汉语分词方法	第19-22页
·基于字符串匹配的分词方法	第19-20页
·基于理解的分词方法	第20页
·基于统计的分词方法	第20-22页
·分词系统的实现.	第22-25页
·最大匹配法分词	第22-23页
·最大匹配法分词存在的问题及解决	第23-25页
·小结	第25-26页
第四章基于词语相关度的特征提取	第26-36页
·基于词频统计的特征提取方法介绍	第26-27页
·基于词频统计的特征提取研究历史及现状	第27-29页
·绝对频率加权法	第27-28页
·向量空间模型	第28页
·基于规则与词典的方法	第28-29页
·基于词频统计的特征提取存在的问题	第29页
·基于词语相关度的特征词提取	第29-31页
·实意词典的构建	第29-30页
·特征词的聚类提取	第30-31页
·基于BP神经网络的特征词权值调整	第31-35页
·误差反传播算法	第31-32页
·BP网络的设计	第32-34页
·网络的训练及仿真	第34-35页
·小结	第35-36页
第五章特征提取的结果评价	第36-39页
·样本集的收集和预处理	第36-37页
·结果分析	第37-39页
第六章结束语	第39-40页
致谢	第40-41页
参考资料	第41-42页
在读期间发表和待发表论文	第42页