首页--文化、科学、教育、体育论文--科学、科学研究论文--情报学、情报工作论文--情报检索论文

基于统计语言学模型的中文文本信息检索

中文摘要第1-6页
英文摘要第6-8页
引  言第8-17页
   ·信息检索简介第8-9页
     ·信息检索的定义第8-9页
     ·信息检索的基本流程第9页
   ·本文的研究背景第9-15页
     ·自然语言处理与统计语言模型第9-15页
     ·本文所研究的问题第15页
   ·本文的研究思路和组织框架第15-17页
第一章 文本检索模型概述第17-29页
   ·传统IR模型:Boolean、VSM、PM第17-23页
     ·三种经典的信息检索模型第17-18页
     ·布尔(Boolean)模型第18页
     ·向量(Vector)模型第18-21页
     ·概率模型第21-23页
   ·基于统计语言学模型的IR模型第23-27页
     ·统计语言学模型(SLM)第23-24页
     ·基于SLM的IR模型第24-27页
   ·各种模型的比较第27-29页
第二章 SLM-IR相关的工作第29-36页
   ·基本模型第29-33页
     ·N元文法(N-gram)第29页
     ·隐马尔科夫模型(HMM)第29-33页
     ·互信息等方法第33页
   ·几种改进模型第33-34页
     ·标题语言模型(Title?Language?Model,sigir2002)第33页
     ·依赖结构模型(Dependency?Structure?Language?Model ,sigir2003)第33-34页
     ·两阶段语言模型(Zhai&Lafferty)第34页
   ·SLM-IR的反馈机制第34-36页
第三章 基于SLM-IR的中文文本检索第36-51页
   ·特征选择(unigram/bigram/trigram/word)第36页
   ·中文分词算法第36-46页
     ·基于词典分词第39-41页
     ·基于统计分词第41-45页
     ·两种分词方法的比较第45-46页
   ·基于中文切分的统计语言模型第46-47页
   ·平滑技术对统计语言模型的影响第47-49页
   ·基于Bigram切分的中文统计语言模型的改进第49-51页
第四章 实验与结论第51-56页
   ·实验准备第51-54页
     ·Lemur工具箱第51-52页
     ·?评价方法第52页
     ·实验数据、实验方法以及其他相关工具第52-54页
   ·实验结果分析第54-56页
     ·中文统计语言模型IR与中文VSM、PM的性能比较分析第54-55页
     ·中文统计语言模型IR之间的性能比较第55-56页
第五章 总结和展望第56-58页
参考文献第58-60页
附录第60-63页
致谢第63-64页
作者简介第64-65页
文献综述第65-72页

论文共72页,点击 下载论文
上一篇:霸权体系与经济增长--克林顿政府贸易政策的政治经济分析
下一篇:酿酒葡萄(Vitis Vinifera L.)不同覆盖节水栽培研究