基于带有通配符序列模式和概率主题模型的多文档摘要技术研究
致谢 | 第9-10页 |
摘要 | 第10-12页 |
ABSTRACT | 第12-13页 |
第一章 绪论 | 第18-22页 |
1.1 研究背景 | 第18-19页 |
1.2 本文的主要工作和创新点 | 第19-20页 |
1.3 论文的组织结构 | 第20-21页 |
1.4 本章小结 | 第21-22页 |
第二章 多文档摘要研究综述 | 第22-34页 |
2.1 自动文档摘要技术及其分类 | 第22-23页 |
2.2 主题表示方法 | 第23-28页 |
2.2.1 主题词 | 第23-24页 |
2.2.2 基于频率的方法 | 第24-26页 |
2.2.3 隐式语义分析 | 第26-27页 |
2.2.4 概率主题模型 | 第27页 |
2.2.5 句子聚类和领域依存的主题 | 第27-28页 |
2.3 上下文的影响 | 第28-30页 |
2.3.1 网页摘要 | 第28-29页 |
2.3.2 科技文章的摘要 | 第29页 |
2.3.3 查询相关的摘要 | 第29页 |
2.3.4 电子邮件摘要 | 第29-30页 |
2.4 摘要中的指示器表示和机器学习 | 第30-32页 |
2.4.1 基于图排序的方法 | 第30-31页 |
2.4.2 机器学习方法 | 第31-32页 |
2.5 选择摘要句子 | 第32-33页 |
2.5.1 贪婪的方法:最大边缘相关性 | 第32-33页 |
2.5.2 全局的摘要选择 | 第33页 |
2.6 结论 | 第33-34页 |
第三章 基于带通配符序列模式的多文档摘要算法研究 | 第34-62页 |
3.1 引言 | 第34-36页 |
3.2 带通配符的模式匹配算法 | 第36-49页 |
3.2.1 相关工作 | 第36-38页 |
3.2.2 问题定义 | 第38-39页 |
3.2.3 算法设计与分析 | 第39-44页 |
3.2.4 实验 | 第44-48页 |
3.2.5 结论 | 第48-49页 |
3.3 基于闭合模式的多文档摘要算法 | 第49-56页 |
3.3.1 基于模式的摘要算法的框架 | 第49-50页 |
3.3.2 闭合模式挖掘 | 第50-51页 |
3.3.3 句子表示 | 第51-54页 |
3.3.4 句子排序 | 第54页 |
3.3.5 句子选择 | 第54-56页 |
3.4 实验结果 | 第56-60页 |
3.4.1 实验设置 | 第56页 |
3.4.2 实验结果 | 第56-58页 |
3.4.3 实验结果分析 | 第58-59页 |
3.4.4 参数设置 | 第59-60页 |
3.4.5 不同的表示方法对算法的影响 | 第60页 |
3.5 结论 | 第60-62页 |
第四章 基于用户评论的多文档摘要算法研究 | 第62-78页 |
4.1 引言 | 第62-64页 |
4.2 主题模型 | 第64-66页 |
4.3 异质文档的主题模型 | 第66-69页 |
4.3.1 模型的描述 | 第66-68页 |
4.3.2 参数估计 | 第68-69页 |
4.4 多文档摘要算法 | 第69-70页 |
4.5 实验 | 第70-77页 |
4.5.1 异质主题模型的性能 | 第70-75页 |
4.5.2 摘要系统的性能 | 第75-77页 |
4.6 总结 | 第77-78页 |
第五章 基于词嵌入模型的短文档主题模型算法研究 | 第78-94页 |
5.1 引言 | 第78-79页 |
5.2 相关工作 | 第79-80页 |
5.2.1 长文档主题模型 | 第79-80页 |
5.2.2 短文档主题模型 | 第80页 |
5.3 算法设计 | 第80-85页 |
5.3.1 词嵌入模型 | 第81页 |
5.3.2 短文档聚类 | 第81-82页 |
5.3.3 主题推理 | 第82-85页 |
5.4 实验 | 第85-92页 |
5.4.1 数据集描述与设置 | 第85-86页 |
5.4.2 实验结果 | 第86-90页 |
5.4.3 案例应用 | 第90-92页 |
5.5 结论 | 第92-94页 |
第六章 总结与展望 | 第94-98页 |
6.1 主要研究工作总结 | 第94-95页 |
6.2 下一步工作 | 第95-98页 |
参考文献 | 第98-110页 |
攻读博士学位期间的学术活动及成果情况 | 第110-112页 |