中文信息检索索引模型及相关技术研究
摘要 | 第1-9页 |
ABSTRACT | 第9-11页 |
第一章 绪论 | 第11-26页 |
·研究背景 | 第11-14页 |
·信息检索的概念 | 第12页 |
·信息检索过程 | 第12-13页 |
·信息检索相关性问题 | 第13-14页 |
·研究现状 | 第14-21页 |
·信息检索核心技术的研究 | 第14-15页 |
·信息检索相关技术 | 第15-21页 |
·存在问题 | 第21-22页 |
·“全”的问题 | 第21-22页 |
·“准”的问题 | 第22页 |
·“相关性”问题 | 第22页 |
·本文工作 | 第22-26页 |
·研究内容 | 第22-24页 |
·本文结构 | 第24-26页 |
第二章 中文文本处理基本技术及信息检索性能评价 | 第26-36页 |
·中文文本处理基本技术 | 第26-33页 |
·中文分词 | 第26-27页 |
·信息处理模型 | 第27-28页 |
·文档表示模型 | 第28-30页 |
·文档特征选择方法 | 第30-33页 |
·信息检索系统性能评价 | 第33-36页 |
第三章 后续有序的互关联后继树索引模型研究 | 第36-53页 |
·引言 | 第36-37页 |
·全文索引模型介绍 | 第37-43页 |
·位图 | 第37页 |
·署名文件 | 第37页 |
·倒排表 | 第37-39页 |
·Pat树和 Pat数组 | 第39-41页 |
·互关联后继树 | 第41-42页 |
·各种索引模型的比较 | 第42-43页 |
·基于后继区间的互关联后继树搜索算法 | 第43-52页 |
·对后续有序的互关联后继树进行定义 | 第43-44页 |
·后继有序的互关联后继树创建算法 | 第44-46页 |
·后续有序互关联后继树查询算法 | 第46-48页 |
·算法复杂度及其性能分析 | 第48-49页 |
·实验与分析 | 第49-52页 |
·小结 | 第52-53页 |
第四章 基于互关联后续树的快速中文分词算法 | 第53-65页 |
·引言 | 第53-54页 |
·中文分词算法介绍 | 第54-57页 |
·基于互关联后继树的分词算法 | 第57-64页 |
·地名的模式结构 | 第57页 |
·组织机构名的模式结构 | 第57-58页 |
·未登录词划分策略 | 第58页 |
·具体算法 | 第58-64页 |
·实验结果 | 第64页 |
·小结 | 第64-65页 |
第五章 基于模拟退火算法的KNN分类算法 | 第65-85页 |
·引言 | 第65-66页 |
·文本分类以及典型算法介绍 | 第66-74页 |
·文本分类及过程 | 第66-68页 |
·文本分类的典型算法 | 第68-74页 |
·基于模拟退火算法的kNN算法 | 第74-84页 |
·k最近邻法的形式化描述 | 第74-75页 |
·KNN存储结构 | 第75-77页 |
·模拟退火算法思想 | 第77-79页 |
·模拟退火算法的 KNN算法 | 第79-81页 |
·实验结果和分析 | 第81-84页 |
·小结 | 第84-85页 |
第六章 基于投影和树的频繁项挖掘 | 第85-109页 |
·引言 | 第85-86页 |
·文本关联规则以及典型算法 | 第86-95页 |
·关联规则基本概念 | 第86-87页 |
·频繁项集挖掘算法分类 | 第87-95页 |
·投影和树频繁项挖掘 | 第95-108页 |
·问题描述 | 第96页 |
·投影和树 | 第96-97页 |
·建树 | 第97-101页 |
·挖掘 | 第101-103页 |
·算法复杂度分析 | 第103页 |
·算法正确性证明 | 第103-105页 |
·实验 | 第105-108页 |
·小结 | 第108-109页 |
第七章 基于本体的中国电信黄页信息检索系统 | 第109-116页 |
·引言 | 第109-110页 |
·本体论以及互关联后继树模型 | 第110-112页 |
·系统和评价 | 第112-115页 |
·小结 | 第115-116页 |
第八章 结束语 | 第116-118页 |
·本文取得的成果 | 第116-117页 |
·进一步的工作 | 第117-118页 |
参考文献 | 第118-124页 |
攻读博士学位期间参与的科研项目及主要成果 | 第124-126页 |
致谢 | 第126-127页 |