文本分割关键技术及其在多文档摘要中的应用研究
摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第一章 绪论 | 第12-30页 |
·文本分割概述 | 第12-19页 |
·文本分割的任务 | 第12页 |
·研究现状 | 第12-19页 |
·多文档摘要概述 | 第19-24页 |
·多文档摘要的任务 | 第20页 |
·研究现状 | 第20-24页 |
·DUC会议 | 第24页 |
·本文研究背景与意义 | 第24-26页 |
·本文研究工作 | 第26-27页 |
·本文内容安排 | 第27-30页 |
第二章 文本相似度计算方法 | 第30-38页 |
·基于向量空间模型的方法 | 第30-32页 |
·二值向量相似性度量 | 第30-31页 |
·实值向量相似性度量 | 第31-32页 |
·基于序列比对的方法 | 第32页 |
·基于潜在语义分析的方法 | 第32-34页 |
·基于文本属性的方法 | 第34-36页 |
·小结 | 第36-38页 |
第三章 基于区域词汇密度的文本分割模型 | 第38-54页 |
·Dotplotting模型 | 第38-39页 |
·Dotplotting模型的问题分析 | 第39-42页 |
·密度函数的对称性 | 第40-41页 |
·已有边界的制约 | 第41-42页 |
·MMD文本分割模型 | 第42-43页 |
·MMD_1模型 | 第42页 |
·MMD_2模型 | 第42-43页 |
·文本分割算法 | 第43页 |
·语义段落长度因子 | 第43-44页 |
·实验 | 第44-51页 |
·评价方法介绍 | 第44-46页 |
·评测语料介绍 | 第46-48页 |
·实验设置 | 第48页 |
·实验结果 | 第48-51页 |
·错误分析 | 第51页 |
·小结 | 第51-54页 |
第四章 基于多元判别分析的文本分割模型 | 第54-68页 |
·多元判别分析 | 第54-56页 |
·MDA文本分割统计模型 | 第56-57页 |
·评价函数 | 第57-60页 |
·基本思想 | 第57-58页 |
·语义段落内散布矩阵S_W | 第58页 |
·语义段落间散布矩阵S_B | 第58-59页 |
·长度因子S_L | 第59页 |
·MDA评价函数J | 第59-60页 |
·文本分割算法 | 第60-61页 |
·实验 | 第61-66页 |
·实验设置 | 第61-62页 |
·评价方法 | 第62页 |
·实验结果 | 第62-65页 |
·相关研究对比 | 第65-66页 |
·小结 | 第66-68页 |
第五章 基于动态规划的文本分割模型 | 第68-88页 |
·动态规划 | 第68-73页 |
·动态规划的适用条件 | 第69-70页 |
·动态规划求解过程 | 第70-72页 |
·多维动态规划 | 第72-73页 |
·MMS文本分割模型 | 第73-79页 |
·问题定义 | 第73页 |
·基本思想 | 第73-75页 |
·评价函数 | 第75-76页 |
·文本结构加权因子 | 第76-77页 |
·文本分割算法 | 第77-79页 |
·实验 | 第79-86页 |
·实验设置 | 第79-81页 |
·评价方法 | 第81页 |
·实验结果 | 第81-86页 |
·小结 | 第86-88页 |
第六章 基于文本分割的多文档摘要技术研究 | 第88-114页 |
·前言 | 第88-89页 |
·多文档摘要系统的一般框架 | 第89-92页 |
·问题相关的多文档摘要任务 | 第92-97页 |
·介绍 | 第92页 |
·关键问题和难点 | 第92-93页 |
·Baseline系统 | 第93-97页 |
·SEG_SUM系统 | 第97-102页 |
·基本思想 | 第97-98页 |
·总体结构 | 第98-100页 |
·具体实现 | 第100-101页 |
·工作流程 | 第101-102页 |
·实验 | 第102-113页 |
·评价指标介绍 | 第102-105页 |
·评测语料介绍 | 第105-106页 |
·实验设置 | 第106页 |
·实验结果 | 第106-112页 |
·错误分析 | 第112-113页 |
·小结 | 第113-114页 |
第七章 结论 | 第114-118页 |
·本文所作的研究工作 | 第114-115页 |
·未来的研究方向 | 第115-116页 |
·关于信息智能处理技术发展趋势的思考 | 第116-118页 |
参考文献 | 第118-130页 |
致谢 | 第130-132页 |
攻读博士期间发表的论文 | 第132页 |