多文档自动文摘关键技术研究
摘要 | 第1-6页 |
Abstract | 第6-15页 |
第1章 绪论 | 第15-31页 |
·目的与意义 | 第15-17页 |
·多文档自动文摘实现策略 | 第17-20页 |
·多文档自动文摘问题描述 | 第17-18页 |
·多文档自动文摘实现策略 | 第18-20页 |
·国内外的研究现状以及发展趋势 | 第20-28页 |
·直接抽取式文摘 | 第20-22页 |
·改进式文摘 | 第22-25页 |
·多文本信息融合式文摘 | 第25-28页 |
·本文的组织结构 | 第28-31页 |
第2章 中文文本时间信息处理 | 第31-50页 |
·引言 | 第31-32页 |
·时间信息的形式化表示 | 第32-39页 |
·句子的时间要素 | 第32-35页 |
·时间信息的形式描述 | 第35-39页 |
·时间表达式的识别 | 第39-42页 |
·组成元素的识别 | 第39-41页 |
·时间表达式的构成 | 第41-42页 |
·时间表达式的语义计算 | 第42-45页 |
·底层时间表达式语义计算 | 第43页 |
·偏移子结合规则 | 第43-44页 |
·偏移量结合规则 | 第44页 |
·时态子结合规则 | 第44-45页 |
·事件之间的时序推理 | 第45-48页 |
·实验分析 | 第48-49页 |
·时间表达式抽取实验 | 第48页 |
·时间表达式语义分析实验 | 第48-49页 |
·结论 | 第49-50页 |
第3章 文本片段相似度计算 | 第50-76页 |
·引言 | 第50-51页 |
·内部相似度计算 | 第51-68页 |
·特征选择 | 第53-56页 |
·边界加权算法 | 第56-59页 |
·特征融合方法 | 第59-66页 |
·基于多特征融合的主题边界确定方法 | 第66-68页 |
·外部相似度计算 | 第68-71页 |
·特征选择 | 第68-69页 |
·片段相似度计算 | 第69-71页 |
·实验与讨论 | 第71-74页 |
·文本切分实验及结果分析 | 第71-73页 |
·外部片段相似度计算实验及结果分析 | 第73-74页 |
·本章小结 | 第74-76页 |
第4章 基于层次主题识别的信息重组 | 第76-93页 |
·引言 | 第76-77页 |
·层次主题 | 第77-79页 |
·主题识别相关研究 | 第79-81页 |
·主题词、片段及主题句识别 | 第79-80页 |
·文本主题切分 | 第80页 |
·基于文本片段聚类的主题抽取 | 第80-81页 |
·层次主题的识别 | 第81-90页 |
·聚类算法 | 第81-82页 |
·动态变阈值层次聚类算法 | 第82-90页 |
·实验分析 | 第90-92页 |
·本章小结 | 第92-93页 |
第5章 基于多文本修辞结构的多文档自动文摘 | 第93-116页 |
·引言 | 第93-94页 |
·多文档的形式化表示 | 第94-101页 |
·修辞结构理论 | 第94-96页 |
·交叉文本结构理论 | 第96-97页 |
·多文本修辞结构MRS | 第97-101页 |
·MRS 的建立 | 第101-104页 |
·篇章修辞结构的确定 | 第101-102页 |
·S 弧权值的确定 | 第102-103页 |
·节点位置的确定 | 第103-104页 |
·基于MRS 的多文档关键信息抽取 | 第104-107页 |
·基于修辞关系的节点权值计算 | 第105-106页 |
·基于MMR 的句子节点约简 | 第106-107页 |
·文摘生成 | 第107-110页 |
·句子排序策略 | 第108-110页 |
·增加文摘连贯性的措施 | 第110页 |
·系统评测 | 第110-115页 |
·评测标准 | 第110-111页 |
·文摘结果评测 | 第111-115页 |
·结束语 | 第115-116页 |
结论 | 第116-118页 |
参考文献 | 第118-129页 |
附录A 多文档自动文摘系统的输出实例 | 第129-138页 |
攻读博士学位期间发表论文情况 | 第138-140页 |
致谢 | 第140-141页 |
个人简历 | 第141页 |