基于向量空间的中文科技文献信息检索系统研究
| 摘要 | 第1-6页 |
| Abstract | 第6-11页 |
| 第1章 绪论 | 第11-16页 |
| ·研究的目的和意义 | 第11页 |
| ·相关的研究内容 | 第11-13页 |
| ·中文科技文献的自动分词 | 第12-13页 |
| ·中文科技文献检索系统 | 第13页 |
| ·本文的主要工作 | 第13-14页 |
| ·本文的组织结构 | 第14-16页 |
| 第2章 科技文献的信息检索模型 | 第16-26页 |
| ·信息检索模型的定义 | 第16页 |
| ·基本概念 | 第16-17页 |
| ·关键词 | 第16-17页 |
| ·权值 | 第17页 |
| ·停用词 | 第17页 |
| ·关键词和权值的集合表示 | 第17页 |
| ·布尔检索模型 | 第17-20页 |
| ·布尔检索模型的理论基础 | 第18页 |
| ·布尔模型中文献的表示 | 第18页 |
| ·布尔模型中查询的表示 | 第18页 |
| ·布尔模型的匹配函数 | 第18-19页 |
| ·布尔模型的优缺点及其改进 | 第19-20页 |
| ·向量空间模型 | 第20-23页 |
| ·向量空间模型的文献空间 | 第20页 |
| ·标引词空间 | 第20页 |
| ·项的权值 | 第20-21页 |
| ·相似度计算 | 第21-23页 |
| ·概率模型 | 第23-25页 |
| ·事件空间 | 第23页 |
| ·相似度的计算 | 第23-25页 |
| ·本章小结 | 第25-26页 |
| 第3章 信息检索系统中的向量空间分析 | 第26-44页 |
| ·空间的表示 | 第26-36页 |
| ·文献空间的表示 | 第26-32页 |
| ·位置空间的表示 | 第32-33页 |
| ·查询空间的表示 | 第33-35页 |
| ·文献关系矩阵的计算及其语义 | 第35-36页 |
| ·文献频率和逆文献频率的计算 | 第36-40页 |
| ·对关键词词频(tf)的规范化 | 第36-38页 |
| ·信息检索系统中逆文献频率(idf)的计算 | 第38-40页 |
| ·检索系统性能的评价 | 第40-43页 |
| ·对传统向量空间的适应 | 第43页 |
| ·本章小结 | 第43-44页 |
| 第4章 关键词分析和自动分词 | 第44-60页 |
| ·关键词分析 | 第45-47页 |
| ·文献的结构分析 | 第47-49页 |
| ·文献的物理结构 | 第47-48页 |
| ·文献的逻辑结构 | 第48-49页 |
| ·汉语自动分词 | 第49-55页 |
| ·分词方法 | 第50-53页 |
| ·自动分词中的歧义处理 | 第53-54页 |
| ·分词词典 | 第54-55页 |
| ·科技文献信息检索系统中的自动分词 | 第55-59页 |
| ·词典的构建 | 第55-56页 |
| ·分词算法 | 第56-59页 |
| ·本章小结 | 第59-60页 |
| 第5章 科技信息检索系统的构建 | 第60-71页 |
| ·文献中关键词的提取 | 第60-61页 |
| ·科技文献的向量表示和分析 | 第61-70页 |
| ·位置向量权值的计算 | 第61-62页 |
| ·位置向量的规范化处理 | 第62-63页 |
| ·文献向量的权值计算 | 第63-64页 |
| ·查询向量的表示 | 第64页 |
| ·文献—关键词矩阵的优化分析 | 第64-69页 |
| ·检索系统的评价 | 第69-70页 |
| ·本章小结 | 第70-71页 |
| 结论 | 第71-73页 |
| 参考文献 | 第73-77页 |
| 攻读硕士学位期间发表的论文和取得的科研成果 | 第77-78页 |
| 致谢 | 第78页 |