基于新闻时空要素的新事件检测方法研究
中文摘要 | 第1-9页 |
ABSTRACT | 第9-11页 |
第1章 引言 | 第11-15页 |
·新事件检测的研究背景及意义 | 第11-12页 |
·新事件检测研究状况 | 第12-13页 |
·本文的主要工作 | 第13页 |
·论文结构 | 第13-15页 |
第2章 新闻事件的模型表示 | 第15-19页 |
·新闻事件与突发事件 | 第15-16页 |
·事件定义 | 第15页 |
·突发事件定义 | 第15-16页 |
·新事件检测的关键技术 | 第16-19页 |
·新闻文档表示模型 | 第16-17页 |
·两种模型比较 | 第17页 |
·相似度计算 | 第17-19页 |
第3章 事件模型的建立 | 第19-23页 |
·新闻语料的预处理 | 第19页 |
·新闻报道特征选择 | 第19-20页 |
·用tf-idf方法计算新闻特征项权值 | 第20-21页 |
·用改进后的tf-idf模型进行事件特征项的计算 | 第21页 |
·新闻簇初始质心的建立 | 第21页 |
·一般内容相似度计算方法 | 第21-23页 |
第4章 突发事件新闻时空主题要素 | 第23-29页 |
·新闻报道中地点信息的处理 | 第23-26页 |
·中文地名的特征 | 第23页 |
·地名库建立和地名信息抽取与规范化 | 第23-25页 |
·地点相似度的计算 | 第25-26页 |
·新闻报道中时间信息的处理 | 第26-27页 |
·新闻文档中与时间相关的信息 | 第26页 |
·时间学习算法 | 第26-27页 |
·时间相似度的计算 | 第27页 |
·相似度的结合 | 第27-29页 |
第5章 基于新闻簇模板更新的新事件检测方法 | 第29-33页 |
·新事件检测描述 | 第29-30页 |
·新闻簇模板质心的更新 | 第30-31页 |
·新闻时空要素的新事件检测流程 | 第31-33页 |
第6章 实验与实验分析 | 第33-39页 |
·实验语料准备 | 第33-34页 |
·一个事件处理流程示例 | 第34-35页 |
·评测机制 | 第35页 |
·实验结果与分析 | 第35-39页 |
第7章 结论 | 第39-41页 |
参考文献 | 第41-45页 |
致谢 | 第45-47页 |
发表文章目录 | 第47-49页 |
个人简况及联系方式 | 第49-50页 |