基于新闻时空要素的新事件检测方法研究
| 中文摘要 | 第1-9页 |
| ABSTRACT | 第9-11页 |
| 第1章 引言 | 第11-15页 |
| ·新事件检测的研究背景及意义 | 第11-12页 |
| ·新事件检测研究状况 | 第12-13页 |
| ·本文的主要工作 | 第13页 |
| ·论文结构 | 第13-15页 |
| 第2章 新闻事件的模型表示 | 第15-19页 |
| ·新闻事件与突发事件 | 第15-16页 |
| ·事件定义 | 第15页 |
| ·突发事件定义 | 第15-16页 |
| ·新事件检测的关键技术 | 第16-19页 |
| ·新闻文档表示模型 | 第16-17页 |
| ·两种模型比较 | 第17页 |
| ·相似度计算 | 第17-19页 |
| 第3章 事件模型的建立 | 第19-23页 |
| ·新闻语料的预处理 | 第19页 |
| ·新闻报道特征选择 | 第19-20页 |
| ·用tf-idf方法计算新闻特征项权值 | 第20-21页 |
| ·用改进后的tf-idf模型进行事件特征项的计算 | 第21页 |
| ·新闻簇初始质心的建立 | 第21页 |
| ·一般内容相似度计算方法 | 第21-23页 |
| 第4章 突发事件新闻时空主题要素 | 第23-29页 |
| ·新闻报道中地点信息的处理 | 第23-26页 |
| ·中文地名的特征 | 第23页 |
| ·地名库建立和地名信息抽取与规范化 | 第23-25页 |
| ·地点相似度的计算 | 第25-26页 |
| ·新闻报道中时间信息的处理 | 第26-27页 |
| ·新闻文档中与时间相关的信息 | 第26页 |
| ·时间学习算法 | 第26-27页 |
| ·时间相似度的计算 | 第27页 |
| ·相似度的结合 | 第27-29页 |
| 第5章 基于新闻簇模板更新的新事件检测方法 | 第29-33页 |
| ·新事件检测描述 | 第29-30页 |
| ·新闻簇模板质心的更新 | 第30-31页 |
| ·新闻时空要素的新事件检测流程 | 第31-33页 |
| 第6章 实验与实验分析 | 第33-39页 |
| ·实验语料准备 | 第33-34页 |
| ·一个事件处理流程示例 | 第34-35页 |
| ·评测机制 | 第35页 |
| ·实验结果与分析 | 第35-39页 |
| 第7章 结论 | 第39-41页 |
| 参考文献 | 第41-45页 |
| 致谢 | 第45-47页 |
| 发表文章目录 | 第47-49页 |
| 个人简况及联系方式 | 第49-50页 |