摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
目录 | 第9-15页 |
第一章 绪论 | 第15-35页 |
第一节 研究背景 | 第15-19页 |
·本研究的缘起 | 第15-16页 |
·目前研究的局限 | 第16-17页 |
·本研究的意义 | 第17-19页 |
第二节 研究综述 | 第19-32页 |
·单语言话题检测与跟踪研究现状 | 第20-29页 |
·跨语言话题检测与跟踪研究现状 | 第29-32页 |
第三节 研究内容 | 第32-34页 |
·跨语言新闻报道文本分析 | 第33页 |
·跨语言话题模型构建方法 | 第33页 |
·语料库构建 | 第33页 |
·跨语言话题检测 | 第33-34页 |
·跨语言话题跟踪 | 第34页 |
本章小结 | 第34-35页 |
第二章 跨语言TDT研究中新闻报道文本描述方法探讨 | 第35-55页 |
第一节 引言 | 第35-36页 |
第二节 跨语言TDT研究中新闻报道文本描述 | 第36-42页 |
·新闻报道的认知方式分析 | 第36-37页 |
·新闻报道认知方式对CLTDT研究启示 | 第37-38页 |
·新闻报道要素分析 | 第38-40页 |
·新闻报道要素对CLTDT研究启示 | 第40-42页 |
第三节 跨语言新闻报道文本特征抽取方法 | 第42-50页 |
·模式识别的概念和主要方法 | 第42-46页 |
·CLTDT研究中命名实体识别方法探讨 | 第46-49页 |
·CLTDT研究中新闻报道基于词汇的文本向量表示方法 | 第49-50页 |
第四节 CLTDT特征抽取实验 | 第50-53页 |
·CLTDT命名实体抽取实验 | 第50-52页 |
·命名实体抽取评测结果 | 第52-53页 |
·实验结果分析 | 第53页 |
本章小结 | 第53-55页 |
第三章 跨语言环境下新闻报道文本模型构建研究 | 第55-79页 |
第一节 引言 | 第55-56页 |
第二节 CLTDT研究中新闻报道模型构建的思路 | 第56-58页 |
·信息检索相关概念 | 第56-57页 |
·“报道-话题-事件”之间的关系 | 第57-58页 |
第三节 文本表示模型 | 第58-69页 |
·主要文本表示模型概述 | 第58-65页 |
·本研究使用的文本表示模型 | 第65-69页 |
第四节 CLTDT英汉新闻报道文本描述模型实验 | 第69-78页 |
·测试语料集选取 | 第69-70页 |
·LSI和LDA模型实验过程 | 第70-77页 |
·LSI和LDA模型实验结果分析 | 第77-78页 |
本章小结 | 第78-79页 |
第四章 CLTDT研究中语料库构建方法 | 第79-94页 |
第一节 语料库概说 | 第79-82页 |
·语料库的概念 | 第79-80页 |
·语料库研究动态 | 第80-82页 |
第二节 跨语言TDT研究语料库的构建 | 第82-91页 |
·数据库语料采集 | 第83-84页 |
·语料库元数据的处理 | 第84页 |
·新闻事件分类 | 第84-88页 |
·新闻语料分词处理与标注 | 第88-90页 |
·新闻语料命名实体标注 | 第90-91页 |
第三节 CLTDT研究的评测策略 | 第91-93页 |
·NIST的TDT评测方法 | 第91-92页 |
·基于信息检索方法的TDT评测方法 | 第92-93页 |
本章小结 | 第93-94页 |
第五章 跨语言话题检测方法研究 | 第94-114页 |
第一节 引言 | 第94页 |
第二节 CLTDT话题检测的任务和流程 | 第94-98页 |
·CLTDT话题检测的任务 | 第94-97页 |
·CLTDT话题检测的流程 | 第97-98页 |
第三节 CLTDT话题检测方法 | 第98-102页 |
·常用的跨语言话题检测方法 | 第98-99页 |
·相似模型对比研究 | 第99-102页 |
第四节 CLTDT话题模型 | 第102-106页 |
·跨语言联合LDA模型 | 第102-104页 |
·跨语言联合LDA模型求解方法 | 第104-106页 |
·跨语言联合LDA新闻事件推断 | 第106页 |
第五节 CLTDT的话题检测 | 第106-112页 |
·开放集新闻事件实验 | 第107-109页 |
·开放集新闻事件实验 | 第109-112页 |
·新事件发现 | 第112页 |
本章小结 | 第112-114页 |
第六章 跨语言话题跟踪方法研究 | 第114-128页 |
第一节 引言 | 第114页 |
第二节 CLTDT话题跟踪的任务和流程 | 第114-116页 |
·CLTDT话题跟踪的任务 | 第114-115页 |
·CLTDT话题跟踪的流程 | 第115-116页 |
第三节 CLTDT话题跟踪的方法 | 第116-123页 |
·早期的话题跟踪方法 | 第116页 |
·目前话题跟踪方法 | 第116-122页 |
·对跨语言话题跟踪方法的改进策略 | 第122-123页 |
第四节 CLTDT话题跟踪实验 | 第123-127页 |
·话题跟踪测试 | 第123-124页 |
·时间序列上的话题演化趋势分析 | 第124-127页 |
本章小结 | 第127-128页 |
第七章 余论 | 第128-130页 |
第一节 本研究的结论 | 第128页 |
第二节 本研究中存在的不足 | 第128-130页 |
参考文献 | 第130-136页 |
致谢 | 第136-137页 |
攻读学位期间发表的学术论文目录 | 第137页 |