摘要 | 第3-4页 |
Abstract | 第4-5页 |
第1章 引言 | 第9-19页 |
1.1 研究背景 | 第9-11页 |
1.2 相关研究现状 | 第11-16页 |
1.2.1 基于新闻报道序列的新闻话题发展过程分析 | 第11-13页 |
1.2.2 基于微博数据的突发新闻事件与用户评论挖掘 | 第13-15页 |
1.2.3 基于科学文献序列的文档重要性量化分析 | 第15-16页 |
1.3 本文的研究内容 | 第16-19页 |
第2章 新闻话题突破点检测 | 第19-40页 |
2.1 概述 | 第19-20页 |
2.2 问题形式化 | 第20-22页 |
2.3 新闻话题空白片段检测 | 第22-25页 |
2.4 新闻话题突破点检测 | 第25-27页 |
2.4.1 新闻报道主题挖掘 | 第25页 |
2.4.2 主题强度波动建模 | 第25-27页 |
2.5 新闻话题时间线摘要生成 | 第27-28页 |
2.6 实验 | 第28-39页 |
2.6.1 数据集构建 | 第28-30页 |
2.6.2 新闻话题空白片段检测结果 | 第30-33页 |
2.6.3 新闻话题突破点检测结果 | 第33-36页 |
2.6.4 时间线摘要生成结果 | 第36-39页 |
2.7 本章小结 | 第39-40页 |
第3章 时序文档连贯度建模 | 第40-66页 |
3.1 概述 | 第40-43页 |
3.2 问题形式化 | 第43-46页 |
3.3 算法框架 | 第46-52页 |
3.3.1 新闻话题连贯度图构建 | 第46-49页 |
3.3.2 新闻话题富信息事件挖掘 | 第49-51页 |
3.3.3 新闻故事线交互抽取 | 第51-52页 |
3.4 实验 | 第52-64页 |
3.4.1 数据集构建 | 第52-54页 |
3.4.2 标准答案构建 | 第54-55页 |
3.4.3 实验设置 | 第55-57页 |
3.4.4 评价指标 | 第57-59页 |
3.4.5 算法调参结果分析 | 第59-62页 |
3.4.6 不同方法结果比较 | 第62-63页 |
3.4.7 用户兴趣整合实验结果 | 第63-64页 |
3.5 本章小结 | 第64-66页 |
第4章 新闻事件相关的文本相似度研究 | 第66-81页 |
4.1 概述 | 第66-68页 |
4.2 问题形式化 | 第68-70页 |
4.3 算法框架 | 第70-74页 |
4.3.1 数据预处理 | 第70-71页 |
4.3.2 同义词替换 | 第71-72页 |
4.3.3 时序 TF-IDF 算法 | 第72-74页 |
4.4 实验 | 第74-80页 |
4.4.1 数据集构建 | 第74-77页 |
4.4.2 实验结果与分析 | 第77-80页 |
4.5 本章小结 | 第80-81页 |
第5章 时序文档重要性量化 | 第81-102页 |
5.1 概述 | 第81-83页 |
5.2 问题形式化与技术挑战 | 第83-85页 |
5.3 算法框架 | 第85-91页 |
5.3.1 候选技术主题挖掘 | 第85-86页 |
5.3.2 技术主题活跃度趋势建模 | 第86-88页 |
5.3.3 专利创新性和影响力量化 | 第88-91页 |
5.4 实验 | 第91-100页 |
5.4.1 数据集构建 | 第91页 |
5.4.2 实验参数设置 | 第91-94页 |
5.4.3 实验评价指标 | 第94-95页 |
5.4.4 实验结果分析 | 第95-100页 |
5.5 核心专利挖掘应用:石油工业公司竞争关系分析 | 第100-101页 |
5.6 本章小结 | 第101-102页 |
第6章 总结与展望 | 第102-104页 |
参考文献 | 第104-112页 |
致谢 | 第112-114页 |
个人简历、在学期间发表的学术论文与研究成果 | 第114-115页 |