首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于统计的NLP技术在中文信息检索中的应用研究

第一章 绪论第1-19页
   ·课题研究背景、目的和意义第12-14页
   ·国内外研究现状第14-16页
     ·NLP 技术的理性主义和经验主义方法第14页
     ·基于NLP 技术的信息检索的研究现状第14-16页
   ·本文主要研究工作和创新之处第16-18页
   ·论文结构第18-19页
第二章 信息检索基本技术介绍第19-38页
   ·基于语料库和统计学的NLP 技术概述第19-20页
   ·向量空间模型(VSM)及其评价第20-25页
     ·传统的向量空间模型第20-22页
     ·对传统向量空间模型评价第22-23页
     ·对向量空间模型的改进——广义向量空间模型第23-25页
   ·信息检索系统及其性能评价第25-28页
     ·SMART 信息检索系统第25-26页
     ·信息检索系统的性能评价第26-28页
   ·信息检索中文档集的组织技术第28-38页
     ·文本聚类技术第29-34页
     ·文本分类技术第34-38页
第三章 中文分词及其对信息检索性能的影响第38-53页
   ·引言第38-40页
   ·信息检索索引单位的选择问题第40-42页
     ·以2 元字符为索引单位进行切分第40-41页
     ·以词为单位进行切分第41-42页
     ·查询与文档分词方案的一致性问题第42页
   ·分词算法的研究第42-47页
     ·最大匹配(MM)分词算法第42-44页
     ·最小匹配分词算法第44-45页
     ·未登录词识别第45-47页
   ·实验设计及结果分析第47-52页
     ·实验1:查询语句中不同长度索引词的比例分析第47-48页
     ·实验2:传统MM 算法和改进MM 算法在分词性能上的比较第48-49页
     ·实验3:分词性能对信息检索结果的影响第49-52页
   ·本章小结第52-53页
第四章 文档关键词的自动提取算法研究第53-67页
   ·引言第53-54页
   ·基于χ~2 统计的单文档关键词提取技术的研究第54-59页
     ·单文档关键词提取方法概述第54页
     ·n-gram 模型与候选关键词的确定第54-55页
     ·词语的共现率的意义第55-57页
     ·词语重要性的数学度量第57页
     ·算法设计第57-58页
     ·实验结果与分析第58-59页
   ·基于朴素贝叶斯理论的多文档关键词提取技术的研究第59-64页
     ·多文档关键词提取方法概述第59-60页
     ·理论基础——朴素贝叶斯模型第60页
     ·算法设计第60-63页
     ·特征项离散化第63-64页
   ·实验结果与分析第64-66页
   ·本章小结第66-67页
第五章 基于向量空间模型的文本分类研究及其应用第67-89页
   ·引言第67-69页
   ·基于向量空间模型的文本分类技术第69-77页
     ·特征抽取与选择第69-72页
     ·文本分类算法的研究第72-75页
     ·文本分类系统的结构第75-76页
     ·实验结果与分析第76-77页
   ·基于向量空间模型的词共现研究及其在文本分类中的应用第77-82页
     ·一般词共现模型第78页
     ·基于向量空间模型的词共现模型第78-79页
     ·实验结果与分析第79-82页
   ·文本分类在消除用户查询歧义中的应用第82-87页
     ·系统设计第83-85页
     ·系统实例说明第85-87页
     ·系统的改进工作第87页
   ·本章小结第87-89页
第六章 线性和非线性维数约减算法在文本聚类中的比较研究第89-110页
   ·引言第89-90页
   ·维数约减算法第90-101页
     ·LSI 算法第90-93页
     ·等距映射(Isomap)算法第93-98页
     ·自组织等距嵌入(SIE)算法第98-101页
   ·聚类算法第101-103页
   ·实验设计与结果分析第103-109页
     ·实验设计第103-104页
     ·实验结果与分析第104-108页
     ·聚类性能的评价指标间的关系探讨第108-109页
   ·本章小结第109-110页
第七章Windows 平台上的基于VSM 的信息检索系统第110-126页
   ·引言第110页
   ·N 层向量空间模型第110-113页
     ·基本思想第110-112页
     ·模型复杂度分析第112-113页
   ·实验系统的构建第113-122页
     ·实验系统的设计第113页
     ·实验系统的组织结构第113-114页
     ·系统主要功能模块的详细设计第114-121页
     ·查询扩展第121页
     ·系统界面第121-122页
   ·实验结果与分析第122-125页
     ·测试集第122页
     ·结果比较第122-125页
   ·本章小结第125-126页
第八章 结论和展望第126-129页
   ·结论第126-127页
   ·未来工作展望第127-129页
参考文献第129-137页
发表论文和科研情况说明第137-138页
致谢第138页

论文共138页,点击 下载论文
上一篇:电信级智能网络信息过滤引擎的研究和应用
下一篇:基于分布智能代理的自保护系统研究