本文的创新点 | 第1-10页 |
图表索引 | 第10-14页 |
摘要 | 第14-17页 |
ABSTRACT | 第17-21页 |
0 引言 | 第21-45页 |
·选题背景和研究意义 | 第21-27页 |
·选题背景 | 第21-26页 |
·研究意义 | 第26-27页 |
·国内外研究综述 | 第27-41页 |
·国内研究进展 | 第28-31页 |
·国外研究进展 | 第31-33页 |
·相关研究述评 | 第33-41页 |
·研究目的、方法与创新 | 第41-45页 |
·研究目的与思路 | 第41-43页 |
·研究方法与工具 | 第43页 |
·本文的创新之处 | 第43-45页 |
1 数字文献资源聚合的概念与理论基础 | 第45-69页 |
·数字文献资源的范畴 | 第45-46页 |
·数字化的信息资源 | 第45-46页 |
·数字文献资源 | 第46页 |
·数字文献资源聚合的内涵与外延 | 第46-53页 |
·聚合的缘起 | 第46-47页 |
·文献资源聚合的内涵 | 第47-49页 |
·文献资源聚合的外延 | 第49-53页 |
·数字文献资源聚合研究的形式和内容 | 第53-56页 |
·数字文献资源聚合的形式 | 第53-54页 |
·数字文献聚合研究内容辨析 | 第54-56页 |
·数字文献资源聚合研究的理论基础 | 第56-61页 |
·文本挖掘理论 | 第56-57页 |
·共现分析理论 | 第57-58页 |
·LSA与LSI理论 | 第58-59页 |
·FA与PA理论 | 第59-60页 |
·信息熵理论 | 第60页 |
·长尾理论 | 第60-61页 |
·数字文献资源聚合的应用方法研究 | 第61-65页 |
·新闻聚合与自动摘要 | 第61-62页 |
·对检索结果的聚类 | 第62-64页 |
·文档管理与个性化信息服务 | 第64页 |
·改善文献分类的结果 | 第64-65页 |
·数字文献资源基于元数据聚合的探索 | 第65-66页 |
·元数据是数字文献资源的特征信息 | 第65页 |
·基于元数据实现文献聚合的可行性 | 第65-66页 |
·本章小结 | 第66-69页 |
2 数字文献资源的高维特征与语义相关性研究 | 第69-93页 |
·数字文献资源的多元和高维特征 | 第69-71页 |
·文献属性的多元特征 | 第69-70页 |
·文献主题的高维特征 | 第70-71页 |
·文献主题的特征选择与评价方法 | 第71-73页 |
·文献主题特征的选择问题 | 第71-72页 |
·特征子集的选取与评价 | 第72-73页 |
·文献特征的高维表示与文献相似性测度方法 | 第73-76页 |
·文献特征的高维向量表示 | 第73-74页 |
·文献相似性与距离的测度 | 第74-76页 |
·向量空间模型及其衍生模型 | 第76-80页 |
·经典VSM模型 | 第76-78页 |
·广义向量空间模型 | 第78-79页 |
·面向中文文献聚类的VSM类模型 | 第79-80页 |
·语义向量空间模型 | 第80-90页 |
·基于VSM的语义相关性研究 | 第81-82页 |
·语义信息增强模型 | 第82-87页 |
·语义核与文献主题相似性 | 第87-90页 |
·本章小结 | 第90-93页 |
3 数字文献资源聚合之共现潜在语义向量空间模型(CLSVSM) | 第93-123页 |
·共现潜在语义的概念 | 第93-96页 |
·语义与语义信息 | 第93-94页 |
·潜在语义与共现潜在语义 | 第94-95页 |
·共现潜在语义的挖掘 | 第95-96页 |
·基于共现潜在语义的文献高维向量表示模型 | 第96-104页 |
·文献高维向量表示的困境 | 第96-97页 |
·模型提出的基础 | 第97-99页 |
·相关定义和记号 | 第99-101页 |
·CLSVSM模型的表示 | 第101-102页 |
·CLSVSM模型的解释 | 第102-104页 |
·CLSVSM模型的推广 | 第104-106页 |
·CLSVSM模型的扩展与简约 | 第104-105页 |
·基于CLSVSM的语义核模型(CLSGVSM) | 第105-106页 |
·基于CLSVSM的数字文献资源聚合 | 第106-116页 |
·基于特征向量聚类的文献聚合步骤 | 第106页 |
·文献的相似矩阵 | 第106-108页 |
·文献集的相似度 | 第108-109页 |
·聚类算法选择 | 第109页 |
·聚类准则函数 | 第109-114页 |
·聚类评价方法 | 第114-116页 |
·CLSVSM模型与VSM衍生模型的类比 | 第116-119页 |
·类比基于关键词相同度的VSM模型 | 第116-117页 |
·类比扭曲VSM模型 | 第117-118页 |
·类比TCABARWC模型 | 第118-119页 |
·本章小结 | 第119-123页 |
4 CLSVSM模型的实验检验与评价 | 第123-159页 |
·文献聚类实验的基本设计 | 第123-125页 |
·实验的目的和要求 | 第123-124页 |
·实验基本流程设计 | 第124-125页 |
·文献聚类评价方法 | 第125-127页 |
·BF指标 | 第125-126页 |
·熵值、纯度和错误率 | 第126-127页 |
·高维向量聚类工具:gCLUTO | 第127-130页 |
·实验文献集的来源与描述 | 第130-138页 |
·数据的选择和采集 | 第130-131页 |
·数据的整理与分析 | 第131-137页 |
·实验数据集的基本统计描述 | 第137-138页 |
·文献聚类实验内容与方案 | 第138-140页 |
·实验的内容 | 第138-139页 |
·实验的步骤 | 第139-140页 |
·实验方案 | 第140页 |
·文献聚类实验结果与分析 | 第140-157页 |
·CLSVSM模型的语义信息增强效果分析 | 第140-142页 |
·CLSVSM模型的聚类效果对比实验 | 第142-154页 |
·采用共现语义核的聚类效果对比实验 | 第154-156页 |
·实验总结:CLSVSM的优势 | 第156-157页 |
·本章小结 | 第157-159页 |
5 CLSVSM模型应用与实证 | 第159-187页 |
·CLSVSM模型的应用范围 | 第159-160页 |
·实证准备 | 第160-162页 |
·实证数据的选择 | 第160-161页 |
·文献聚类簇数目的确定 | 第161-162页 |
·基于CLSVSM模型的聚合实证研究 | 第162-184页 |
·实证Ⅰ——以概率论与数理统计学科抽样文献为例 | 第162-174页 |
·实证Ⅱ——以信息资源建设主题的检索文献集为例 | 第174-184页 |
·本章小结 | 第184-187页 |
6 总结与展望 | 第187-193页 |
·总结与启示 | 第187-189页 |
·不足与展望 | 第189-193页 |
参考文献 | 第193-203页 |
读博期间科研及获奖情况 | 第203-205页 |
致谢 | 第205-206页 |