基于向量空间的中文科技文献信息检索系统研究
摘要 | 第1-6页 |
Abstract | 第6-11页 |
第1章 绪论 | 第11-16页 |
·研究的目的和意义 | 第11页 |
·相关的研究内容 | 第11-13页 |
·中文科技文献的自动分词 | 第12-13页 |
·中文科技文献检索系统 | 第13页 |
·本文的主要工作 | 第13-14页 |
·本文的组织结构 | 第14-16页 |
第2章 科技文献的信息检索模型 | 第16-26页 |
·信息检索模型的定义 | 第16页 |
·基本概念 | 第16-17页 |
·关键词 | 第16-17页 |
·权值 | 第17页 |
·停用词 | 第17页 |
·关键词和权值的集合表示 | 第17页 |
·布尔检索模型 | 第17-20页 |
·布尔检索模型的理论基础 | 第18页 |
·布尔模型中文献的表示 | 第18页 |
·布尔模型中查询的表示 | 第18页 |
·布尔模型的匹配函数 | 第18-19页 |
·布尔模型的优缺点及其改进 | 第19-20页 |
·向量空间模型 | 第20-23页 |
·向量空间模型的文献空间 | 第20页 |
·标引词空间 | 第20页 |
·项的权值 | 第20-21页 |
·相似度计算 | 第21-23页 |
·概率模型 | 第23-25页 |
·事件空间 | 第23页 |
·相似度的计算 | 第23-25页 |
·本章小结 | 第25-26页 |
第3章 信息检索系统中的向量空间分析 | 第26-44页 |
·空间的表示 | 第26-36页 |
·文献空间的表示 | 第26-32页 |
·位置空间的表示 | 第32-33页 |
·查询空间的表示 | 第33-35页 |
·文献关系矩阵的计算及其语义 | 第35-36页 |
·文献频率和逆文献频率的计算 | 第36-40页 |
·对关键词词频(tf)的规范化 | 第36-38页 |
·信息检索系统中逆文献频率(idf)的计算 | 第38-40页 |
·检索系统性能的评价 | 第40-43页 |
·对传统向量空间的适应 | 第43页 |
·本章小结 | 第43-44页 |
第4章 关键词分析和自动分词 | 第44-60页 |
·关键词分析 | 第45-47页 |
·文献的结构分析 | 第47-49页 |
·文献的物理结构 | 第47-48页 |
·文献的逻辑结构 | 第48-49页 |
·汉语自动分词 | 第49-55页 |
·分词方法 | 第50-53页 |
·自动分词中的歧义处理 | 第53-54页 |
·分词词典 | 第54-55页 |
·科技文献信息检索系统中的自动分词 | 第55-59页 |
·词典的构建 | 第55-56页 |
·分词算法 | 第56-59页 |
·本章小结 | 第59-60页 |
第5章 科技信息检索系统的构建 | 第60-71页 |
·文献中关键词的提取 | 第60-61页 |
·科技文献的向量表示和分析 | 第61-70页 |
·位置向量权值的计算 | 第61-62页 |
·位置向量的规范化处理 | 第62-63页 |
·文献向量的权值计算 | 第63-64页 |
·查询向量的表示 | 第64页 |
·文献—关键词矩阵的优化分析 | 第64-69页 |
·检索系统的评价 | 第69-70页 |
·本章小结 | 第70-71页 |
结论 | 第71-73页 |
参考文献 | 第73-77页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第77-78页 |
致谢 | 第78页 |