基于内容的文本分割关键技术
摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第1章 绪论 | 第10-16页 |
·文本分割 | 第10-11页 |
·研究现状 | 第11-12页 |
·基于词汇浅层信息 | 第11-12页 |
·基于词汇语义信息 | 第12页 |
·研究背景 | 第12-13页 |
·本文工作 | 第13-15页 |
·论文组织 | 第15-16页 |
第2章 文本分割研究内容 | 第16-26页 |
·分割粒度 | 第16页 |
·相似度计算 | 第16-18页 |
·权重分配 | 第16-17页 |
·计算公式 | 第17-18页 |
·主题相似性评价 | 第18-19页 |
·边界搜索策略 | 第19-20页 |
·终止条件 | 第20-21页 |
·评测方法 | 第21-22页 |
·P_k评测度量 | 第21-22页 |
·WindowDiff | 第22页 |
·评测语料 | 第22-26页 |
·合成语料 | 第22-24页 |
·自然语料 | 第24-26页 |
第3章 基于词汇密度的文本分割模型 | 第26-36页 |
·Dotplotting模型 | 第26-29页 |
·模型分析 | 第26-28页 |
·Dotplotting搜索策略 | 第28页 |
·算法描述 | 第28-29页 |
·C99模型 | 第29-31页 |
·锐化处理技术 | 第29-30页 |
·分裂式聚类 | 第30-31页 |
·阀值终止条件 | 第31页 |
·MMD模型 | 第31-32页 |
·Dotplotting模型问题分析 | 第31页 |
·评价函数设计 | 第31-32页 |
·实验 | 第32-35页 |
·对比实验 | 第33-34页 |
·锐化窗口性能实验 | 第34-35页 |
·小结 | 第35-36页 |
第4章 基于动态规划的文本分割模型 | 第36-54页 |
·主题相似性线索 | 第36-40页 |
·区域内相似度 | 第36-37页 |
·区域间相似度 | 第37-39页 |
·文本区域长度 | 第39页 |
·重现词汇距离 | 第39-40页 |
·评价函数设计 | 第40-42页 |
·长度因子 | 第41页 |
·密度因子 | 第41-42页 |
·基于动态规划的文本分割建模 | 第42-46页 |
·动态规划引例 | 第42-43页 |
·动态规划原理 | 第43-44页 |
·多维动态规划 | 第44页 |
·文本分割问题 | 第44-46页 |
·一维动态规划算法描述 | 第46页 |
·MMF模型 | 第46-50页 |
·MMF_1评价函数 | 第48页 |
·MMF_2评价函数 | 第48-49页 |
·二维动态规划算法描述 | 第49-50页 |
·实验 | 第50-53页 |
·重现实验 | 第50页 |
·对比实验 | 第50-52页 |
·主题相似性线索有效性实验 | 第52-53页 |
·小结 | 第53-54页 |
第5章 基于潜在语义分析的文本分割模型 | 第54-66页 |
·潜在语义分析基本原理 | 第54-57页 |
·LSA基本原理 | 第54-55页 |
·截断的奇异值分解 | 第55-57页 |
·DLSA模型 | 第57-63页 |
·语义关系 | 第57-62页 |
·模型训练 | 第62-63页 |
·相似度矩阵 | 第63页 |
·实验 | 第63-65页 |
·对比实验 | 第63-64页 |
·空间维度性能实验 | 第64-65页 |
·小结 | 第65-66页 |
第6章 总结 | 第66-68页 |
·研究工作总结 | 第66页 |
·未来工作展望 | 第66-68页 |
参考文献 | 第68-72页 |
致谢 | 第72-74页 |
攻读硕士期间发表的论文 | 第74页 |