摘要 | 第10-11页 |
ABSTRACT(英文摘要) | 第11页 |
主要符号对照表 | 第12-13页 |
第一章 引言 | 第13-22页 |
§1.1 研究背景与意义 | 第13-17页 |
§1.1.1 文本挖掘 | 第13-15页 |
§1.1.2 文本分割 | 第15-17页 |
§1.2 国内外研究现状 | 第17-19页 |
§1.3 本文的研究方法 | 第19-20页 |
§1.4 文本的研究难点与挑战 | 第20页 |
§1.5 本文的研究内容与创新 | 第20-21页 |
§1.6 本文的组织架构 | 第21-22页 |
第二章 文本分割技术 | 第22-32页 |
§2.1 文本相似度计算方法 | 第22-24页 |
§2.2 边界识别方法 | 第24-25页 |
§2.3 TextTiling算法 | 第25-29页 |
§2.3.1 文档的拓扑结构 | 第25-26页 |
§2.3.2 TextTiling算法具体介绍 | 第26-29页 |
§2.3.3 算法可改进空间 | 第29页 |
§2.4 C99算法 | 第29-31页 |
§2.5 小结 | 第31-32页 |
第三章 AdaText Tiling文本分割技术 | 第32-42页 |
§3.1 Sim-Ada TextTiling算法介绍 | 第32-35页 |
§3.2 计算效率优化 | 第35-36页 |
§3.3 AdaText Tiling算法介绍 | 第36-41页 |
§3.3.1 LDA主题模型介绍 | 第36-39页 |
§3.3.2 结合主题模型和分割算法 | 第39-40页 |
§3.3.3 技术实现部分简介 | 第40-41页 |
§3.4 小结 | 第41-42页 |
第四章 实验评估 | 第42-51页 |
§4.1 实验数据 | 第42-43页 |
§4.2 效果评价指标 | 第43-45页 |
§4.2.1 准确率和召回率 | 第43-44页 |
§4.2.2 P_k指标 | 第44页 |
§4.2.3 WD指标 | 第44-45页 |
§4.3 实验设计 | 第45-46页 |
§4.3.1 评价指标选择 | 第45页 |
§4.3.2 初始参数选取 | 第45-46页 |
§4.3.3 训练集和验证集 | 第46页 |
§4.4 实验分析 | 第46-50页 |
§4.4.1 训练AdaText Tiling算法 | 第46-50页 |
§4.4.2 验证AdaText Tiling算法 | 第50页 |
§4.5 小结 | 第50-51页 |
结论 | 第51-53页 |
研究工作总结 | 第51页 |
未来工作展望 | 第51-53页 |
参考文献 | 第53-56页 |
致谢 | 第56页 |