文本检索中若干问题研究
| 第一章 绪论 | 第1-19页 |
| ·选题意义 | 第11-12页 |
| ·国内外研究现状 | 第12-14页 |
| ·本文拟解决的问题 | 第14-15页 |
| ·本文的创新点 | 第15-16页 |
| ·本文内容安排 | 第16-18页 |
| 本章参考文献 | 第18-19页 |
| 第二章 信息检索的相关技术 | 第19-37页 |
| ·引言 | 第19-20页 |
| ·信息检索 | 第19页 |
| ·本章内容安排 | 第19-20页 |
| ·信息检索模型 | 第20-24页 |
| ·布尔模型 | 第20-21页 |
| ·概率模型 | 第21-22页 |
| ·向量空间模型 | 第22-24页 |
| ·信息检索系统 | 第24页 |
| ·信息检索中的相关技术 | 第24-34页 |
| ·中文信息检索的分词 | 第25-29页 |
| ·索引建立 | 第29-32页 |
| ·评价指标 | 第32-34页 |
| ·本章小结 | 第34-35页 |
| 本章参考文献 | 第35-37页 |
| 第三章 文本分类技术研究 | 第37-67页 |
| ·引言 | 第37-38页 |
| ·方法提出背景 | 第37页 |
| ·本章内容安排 | 第37-38页 |
| ·文本分类 | 第38-47页 |
| ·问题描述 | 第38页 |
| ·相关技术概述 | 第38-47页 |
| ·特征选择 | 第47-57页 |
| ·常用的评价函数 | 第48-51页 |
| ·基于互信息可信度的特征选择算法 | 第51-54页 |
| ·归一化和局部的特征选择 | 第54-57页 |
| ·特征抽取 | 第57-60页 |
| ·词-文档矩阵 | 第58页 |
| ·PCA和LDA介绍 | 第58-59页 |
| ·实验结果 | 第59-60页 |
| ·多类判别问题 | 第60-64页 |
| ·问题提出 | 第60-61页 |
| ·评估指标最大化阈值确定法 | 第61-63页 |
| ·算法实现及实验结果 | 第63-64页 |
| ·本章小结 | 第64-65页 |
| 本章参考文献 | 第65-67页 |
| 第四章 查询优化的相关研究 | 第67-88页 |
| ·引言 | 第67页 |
| ·方法提出背景 | 第67页 |
| ·本章主要内容 | 第67页 |
| ·查询扩展 | 第67-71页 |
| ·问题描述 | 第67-68页 |
| ·查询扩展方法 | 第68-71页 |
| ·基于改进互信息的查询扩展 | 第71-79页 |
| ·关键词与查询间的互信息 | 第71-72页 |
| ·基于距离的互信息计算 | 第72-74页 |
| ·关键词之间的距离计算 | 第74-76页 |
| ·实验结果 | 第76-79页 |
| ·查询语词重新加权 | 第79-85页 |
| ·相关反馈 | 第79-80页 |
| ·伪相关反馈 | 第80-81页 |
| ·局部聚类相关反馈 | 第81页 |
| ·可变权值的伪相关反馈 | 第81-82页 |
| ·实验结果 | 第82-85页 |
| ·本章小结 | 第85-86页 |
| 本章参考文献 | 第86-88页 |
| 第五章 文本图像检索的相关研究 | 第88-112页 |
| ·引言 | 第88-89页 |
| ·文本图像的检索 | 第88-89页 |
| ·本章内容安排 | 第89页 |
| ·传统的OCR技术 | 第89-100页 |
| ·OCR技术的关键技术 | 第90页 |
| ·图像二值化 | 第90-91页 |
| ·手写数字切分算法 | 第91-100页 |
| ·惯性大水滴滴水算法 | 第100-109页 |
| ·TDF算法的数学描述 | 第101-103页 |
| ·惯性滴水算法(IDF) | 第103-105页 |
| ·大水滴及惯性滴水算法(BIDF) | 第105-106页 |
| ·寻找切分起始点 | 第106-107页 |
| ·实验结果 | 第107-109页 |
| ·本章小结 | 第109-110页 |
| 本章参考文献 | 第110-112页 |
| 第六章 总结和展望 | 第112-115页 |
| ·论文总结 | 第112-113页 |
| ·未来工作展望 | 第113-115页 |
| 致谢 | 第115-116页 |
| 博士期间完成的主要论文 | 第116页 |