基于内容的文本分割关键技术
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第1章 绪论 | 第10-16页 |
| ·文本分割 | 第10-11页 |
| ·研究现状 | 第11-12页 |
| ·基于词汇浅层信息 | 第11-12页 |
| ·基于词汇语义信息 | 第12页 |
| ·研究背景 | 第12-13页 |
| ·本文工作 | 第13-15页 |
| ·论文组织 | 第15-16页 |
| 第2章 文本分割研究内容 | 第16-26页 |
| ·分割粒度 | 第16页 |
| ·相似度计算 | 第16-18页 |
| ·权重分配 | 第16-17页 |
| ·计算公式 | 第17-18页 |
| ·主题相似性评价 | 第18-19页 |
| ·边界搜索策略 | 第19-20页 |
| ·终止条件 | 第20-21页 |
| ·评测方法 | 第21-22页 |
| ·P_k评测度量 | 第21-22页 |
| ·WindowDiff | 第22页 |
| ·评测语料 | 第22-26页 |
| ·合成语料 | 第22-24页 |
| ·自然语料 | 第24-26页 |
| 第3章 基于词汇密度的文本分割模型 | 第26-36页 |
| ·Dotplotting模型 | 第26-29页 |
| ·模型分析 | 第26-28页 |
| ·Dotplotting搜索策略 | 第28页 |
| ·算法描述 | 第28-29页 |
| ·C99模型 | 第29-31页 |
| ·锐化处理技术 | 第29-30页 |
| ·分裂式聚类 | 第30-31页 |
| ·阀值终止条件 | 第31页 |
| ·MMD模型 | 第31-32页 |
| ·Dotplotting模型问题分析 | 第31页 |
| ·评价函数设计 | 第31-32页 |
| ·实验 | 第32-35页 |
| ·对比实验 | 第33-34页 |
| ·锐化窗口性能实验 | 第34-35页 |
| ·小结 | 第35-36页 |
| 第4章 基于动态规划的文本分割模型 | 第36-54页 |
| ·主题相似性线索 | 第36-40页 |
| ·区域内相似度 | 第36-37页 |
| ·区域间相似度 | 第37-39页 |
| ·文本区域长度 | 第39页 |
| ·重现词汇距离 | 第39-40页 |
| ·评价函数设计 | 第40-42页 |
| ·长度因子 | 第41页 |
| ·密度因子 | 第41-42页 |
| ·基于动态规划的文本分割建模 | 第42-46页 |
| ·动态规划引例 | 第42-43页 |
| ·动态规划原理 | 第43-44页 |
| ·多维动态规划 | 第44页 |
| ·文本分割问题 | 第44-46页 |
| ·一维动态规划算法描述 | 第46页 |
| ·MMF模型 | 第46-50页 |
| ·MMF_1评价函数 | 第48页 |
| ·MMF_2评价函数 | 第48-49页 |
| ·二维动态规划算法描述 | 第49-50页 |
| ·实验 | 第50-53页 |
| ·重现实验 | 第50页 |
| ·对比实验 | 第50-52页 |
| ·主题相似性线索有效性实验 | 第52-53页 |
| ·小结 | 第53-54页 |
| 第5章 基于潜在语义分析的文本分割模型 | 第54-66页 |
| ·潜在语义分析基本原理 | 第54-57页 |
| ·LSA基本原理 | 第54-55页 |
| ·截断的奇异值分解 | 第55-57页 |
| ·DLSA模型 | 第57-63页 |
| ·语义关系 | 第57-62页 |
| ·模型训练 | 第62-63页 |
| ·相似度矩阵 | 第63页 |
| ·实验 | 第63-65页 |
| ·对比实验 | 第63-64页 |
| ·空间维度性能实验 | 第64-65页 |
| ·小结 | 第65-66页 |
| 第6章 总结 | 第66-68页 |
| ·研究工作总结 | 第66页 |
| ·未来工作展望 | 第66-68页 |
| 参考文献 | 第68-72页 |
| 致谢 | 第72-74页 |
| 攻读硕士期间发表的论文 | 第74页 |