基于统计语言学模型的中文文本信息检索

中文摘要	第1-6页
英文摘要	第6-8页
引言	第8-17页
·信息检索简介	第8-9页
·信息检索的定义	第8-9页
·信息检索的基本流程	第9页
·本文的研究背景	第9-15页
·自然语言处理与统计语言模型	第9-15页
·本文所研究的问题	第15页
·本文的研究思路和组织框架	第15-17页
第一章文本检索模型概述	第17-29页
·传统IR模型:Boolean、VSM、PM	第17-23页
·三种经典的信息检索模型	第17-18页
·布尔(Boolean)模型	第18页
·向量(Vector)模型	第18-21页
·概率模型	第21-23页
·基于统计语言学模型的IR模型	第23-27页
·统计语言学模型(SLM)	第23-24页
·基于SLM的IR模型	第24-27页
·各种模型的比较	第27-29页
第二章 SLM-IR相关的工作	第29-36页
·基本模型	第29-33页
·N元文法(N-gram)	第29页
·隐马尔科夫模型(HMM)	第29-33页
·互信息等方法	第33页
·几种改进模型	第33-34页
·标题语言模型(Title?Language?Model,sigir2002)	第33页
·依赖结构模型(Dependency?Structure?Language?Model ,sigir2003)	第33-34页
·两阶段语言模型(Zhai&Lafferty)	第34页
·SLM-IR的反馈机制	第34-36页
第三章基于SLM-IR的中文文本检索	第36-51页
·特征选择(unigram/bigram/trigram/word)	第36页
·中文分词算法	第36-46页
·基于词典分词	第39-41页
·基于统计分词	第41-45页
·两种分词方法的比较	第45-46页
·基于中文切分的统计语言模型	第46-47页
·平滑技术对统计语言模型的影响	第47-49页
·基于Bigram切分的中文统计语言模型的改进	第49-51页
第四章实验与结论	第51-56页
·实验准备	第51-54页
·Lemur工具箱	第51-52页
·?评价方法	第52页
·实验数据、实验方法以及其他相关工具	第52-54页
·实验结果分析	第54-56页
·中文统计语言模型IR与中文VSM、PM的性能比较分析	第54-55页
·中文统计语言模型IR之间的性能比较	第55-56页
第五章总结和展望	第56-58页
参考文献	第58-60页
附录	第60-63页
致谢	第63-64页
作者简介	第64-65页
文献综述	第65-72页