基于独立分量分析的语义聚类技术在信息检索中的应用研究
摘要 | 第1-7页 |
ABSTRACT | 第7-13页 |
第一章 绪论 | 第13-20页 |
·研究背景 | 第13-14页 |
·研究动机 | 第14-16页 |
·不同聚类空间文档结构表示问题 | 第14-15页 |
·传统查询扩展技术存在的问题 | 第15页 |
·统计语言模型的灵活性 | 第15-16页 |
·传统的相关模型和查询模型估计中存在的问题 | 第16页 |
·主要工作 | 第16-17页 |
·创新点 | 第17-18页 |
·本文章节安排 | 第18-20页 |
第二章 相关研究工作与理论基础 | 第20-44页 |
·检索性能主要评测指标 | 第21页 |
·信息检索中的相关反馈技术与查询扩展技术 | 第21-29页 |
·相关反馈方法 | 第23-27页 |
·向量空间模型的有关定义 | 第23-25页 |
·词条权重计算 | 第25-26页 |
·基于向量空间模型的查询向量变形法 | 第26-27页 |
·基于概率模型的查询词条权重计算法 | 第27页 |
·查询扩展词条的选择技术 | 第27-28页 |
·同现关系发现查询扩展词条 | 第28页 |
·选择性查询扩展 | 第28-29页 |
·查询清晰度函数 | 第29页 |
·平均反向文档频率 | 第29页 |
·信息检索中统计语言模型的研究现状 | 第29-39页 |
·信息检索中统计语言模型和概率模型的区别 | 第31页 |
·查询似然语言模型 | 第31-34页 |
·文档语言模型的定义 | 第32页 |
·文档语言模型的估计 | 第32-33页 |
·文档语言模型的平滑方法 | 第33-34页 |
·查询语言模型 | 第34-37页 |
·基于聚类的统计语言模型 | 第37-39页 |
·信息检索中的潜在语义索引技术 | 第39-40页 |
·文本数据处理中的独立分量分析技术 | 第40-42页 |
·本章小结 | 第42-44页 |
第三章 基于独立分量分析的语义聚类理论研究 | 第44-65页 |
·潜在语义空间 | 第44-48页 |
·潜在语义空间的相关定义 | 第44-46页 |
·潜在语义空间的生成 | 第46-48页 |
·奇异值分解 | 第46-47页 |
·主分量分析 | 第47-48页 |
·独立分量分析 | 第48-55页 |
·分量统计独立性及判据函数 | 第49-53页 |
·Kullback-Leibler 散度 | 第49-50页 |
·互信息极小化判据函数 | 第50-51页 |
·信息极大化判据函数 | 第51-52页 |
·极大似然判据函数 | 第52-53页 |
·独立分量分析常用算法 | 第53-55页 |
·信息极大算法 | 第53页 |
·负熵固定点算法 | 第53-55页 |
·基于独立分量分析的语义聚类模型 | 第55-64页 |
·潜在语义空间到ICA 语义空间的变换 | 第55-57页 |
·语义聚类模型 | 第57-59页 |
·语义聚类与主题距离的相关定义 | 第57-58页 |
·基于ICA 的语义聚类模型 | 第58-59页 |
·语义聚类可靠性分析 | 第59-64页 |
·语义聚类可靠性分析的必要性 | 第59-60页 |
·独立分量估计的可靠性分析 | 第60-62页 |
·语义聚类可靠性分析实验 | 第62-64页 |
·本章小结 | 第64-65页 |
第四章 基于独立分量分析的语义聚类应用研究 | 第65-86页 |
·自定义语料库的构建方法 | 第65-69页 |
·Web 主题文本提取方法 | 第65-67页 |
·Web 主题文本提取实验 | 第67-69页 |
·相关结论 | 第69页 |
·图书馆个性化服务 | 第69-74页 |
·语义聚类建立动态映射关系 | 第70-71页 |
·系统体系结构 | 第71-72页 |
·个性化服务实验 | 第72-74页 |
·相关结论 | 第74页 |
·用户信息推荐服务 | 第74-80页 |
·用户兴趣模型的表示 | 第74-75页 |
·词条权重计算的改进 | 第75-77页 |
·用户信息推荐服务实验 | 第77-80页 |
·相关结论 | 第80页 |
·短文档分类问题 | 第80-84页 |
·短文档面临的问题 | 第80-81页 |
·实验设计 | 第81-82页 |
·实验结果与分析 | 第82-84页 |
·相关结论 | 第84页 |
·本章小结 | 第84-86页 |
第五章 查询扩展技术应用研究 | 第86-99页 |
·查询扩展概述 | 第86-87页 |
·向量空间中的理论解释 | 第86-87页 |
·查询扩展时机 | 第87页 |
·查询扩展在地理信息检索中的应用研究 | 第87-98页 |
·基于地理坐标抽取与聚类的地理查询扩展系统 | 第88-92页 |
·基于维基百科的地理查询扩展系统 | 第92页 |
·实验结果与分析 | 第92-98页 |
·查询扩展词条的主题距离 | 第92-93页 |
·实验数据集与工具 | 第93-95页 |
·实验结果 | 第95-96页 |
·实验分析 | 第96-98页 |
·本章小结 | 第98-99页 |
第六章 基于统计语义聚类的语言模型研究 | 第99-130页 |
·语义聚类的激活 | 第99-102页 |
·激活理论 | 第99-101页 |
·激活过程 | 第101-102页 |
·主题距离激活方法 | 第101-102页 |
·查询和文档词条同现关系激活方法 | 第102页 |
·基于统计语义聚类的相关模型估计 | 第102-118页 |
·相关模型估计方法的改进 | 第102-104页 |
·相关模型估计方法 | 第104-105页 |
·实验设计 | 第105-108页 |
·实验数据集与工具 | 第105-107页 |
·实验参数和术语设定 | 第107-108页 |
·实验内容 | 第108页 |
·实验结果与分析 | 第108-118页 |
·语义聚类相关模型改善查询性能 | 第108-115页 |
·语义聚类的质量测试 | 第115-118页 |
·相关结论 | 第118页 |
·基于统计语义聚类的查询模型估计 | 第118-128页 |
·查询模型概述 | 第118-119页 |
·查询模型估计方法 | 第119-121页 |
·实验设计 | 第121-123页 |
·实验数据集与工具 | 第121-122页 |
·实验参数设定 | 第122页 |
·实验内容 | 第122-123页 |
·实验结果与分析 | 第123-128页 |
·语义聚类对反馈文档质量的影响 | 第123-124页 |
·语义聚类反馈文档数量对检索结果的影响 | 第124-125页 |
·基于聚类的检索方法检索效果比较 | 第125-126页 |
·语义关键词条聚类对检索结果的影响 | 第126-127页 |
·语义聚类文档先验概率对检索结果的影响 | 第127-128页 |
·相关结论 | 第128页 |
·本章小结 | 第128-130页 |
第七章 全文总结及未来工作 | 第130-132页 |
·全文总结 | 第130-131页 |
·未来工作 | 第131-132页 |
致谢 | 第132-134页 |
参考文献 | 第134-145页 |
攻博期间取得的研究成果 | 第145-147页 |