首页--语言、文字论文--汉语论文--写作、修辞论文

英、汉跨语言话题检测与跟踪技术研究

摘要第1-6页
ABSTRACT第6-9页
目录第9-15页
第一章 绪论第15-35页
 第一节 研究背景第15-19页
     ·本研究的缘起第15-16页
     ·目前研究的局限第16-17页
     ·本研究的意义第17-19页
 第二节 研究综述第19-32页
     ·单语言话题检测与跟踪研究现状第20-29页
     ·跨语言话题检测与跟踪研究现状第29-32页
 第三节 研究内容第32-34页
     ·跨语言新闻报道文本分析第33页
     ·跨语言话题模型构建方法第33页
     ·语料库构建第33页
     ·跨语言话题检测第33-34页
     ·跨语言话题跟踪第34页
 本章小结第34-35页
第二章 跨语言TDT研究中新闻报道文本描述方法探讨第35-55页
 第一节 引言第35-36页
 第二节 跨语言TDT研究中新闻报道文本描述第36-42页
     ·新闻报道的认知方式分析第36-37页
     ·新闻报道认知方式对CLTDT研究启示第37-38页
     ·新闻报道要素分析第38-40页
     ·新闻报道要素对CLTDT研究启示第40-42页
 第三节 跨语言新闻报道文本特征抽取方法第42-50页
     ·模式识别的概念和主要方法第42-46页
     ·CLTDT研究中命名实体识别方法探讨第46-49页
     ·CLTDT研究中新闻报道基于词汇的文本向量表示方法第49-50页
 第四节 CLTDT特征抽取实验第50-53页
     ·CLTDT命名实体抽取实验第50-52页
     ·命名实体抽取评测结果第52-53页
     ·实验结果分析第53页
 本章小结第53-55页
第三章 跨语言环境下新闻报道文本模型构建研究第55-79页
 第一节 引言第55-56页
 第二节 CLTDT研究中新闻报道模型构建的思路第56-58页
     ·信息检索相关概念第56-57页
     ·“报道-话题-事件”之间的关系第57-58页
 第三节 文本表示模型第58-69页
     ·主要文本表示模型概述第58-65页
     ·本研究使用的文本表示模型第65-69页
 第四节 CLTDT英汉新闻报道文本描述模型实验第69-78页
     ·测试语料集选取第69-70页
     ·LSI和LDA模型实验过程第70-77页
     ·LSI和LDA模型实验结果分析第77-78页
 本章小结第78-79页
第四章 CLTDT研究中语料库构建方法第79-94页
 第一节 语料库概说第79-82页
     ·语料库的概念第79-80页
     ·语料库研究动态第80-82页
 第二节 跨语言TDT研究语料库的构建第82-91页
     ·数据库语料采集第83-84页
     ·语料库元数据的处理第84页
     ·新闻事件分类第84-88页
     ·新闻语料分词处理与标注第88-90页
     ·新闻语料命名实体标注第90-91页
 第三节 CLTDT研究的评测策略第91-93页
     ·NIST的TDT评测方法第91-92页
     ·基于信息检索方法的TDT评测方法第92-93页
 本章小结第93-94页
第五章 跨语言话题检测方法研究第94-114页
 第一节 引言第94页
 第二节 CLTDT话题检测的任务和流程第94-98页
     ·CLTDT话题检测的任务第94-97页
     ·CLTDT话题检测的流程第97-98页
 第三节 CLTDT话题检测方法第98-102页
     ·常用的跨语言话题检测方法第98-99页
     ·相似模型对比研究第99-102页
 第四节 CLTDT话题模型第102-106页
     ·跨语言联合LDA模型第102-104页
     ·跨语言联合LDA模型求解方法第104-106页
     ·跨语言联合LDA新闻事件推断第106页
 第五节 CLTDT的话题检测第106-112页
     ·开放集新闻事件实验第107-109页
     ·开放集新闻事件实验第109-112页
     ·新事件发现第112页
 本章小结第112-114页
第六章 跨语言话题跟踪方法研究第114-128页
 第一节 引言第114页
 第二节 CLTDT话题跟踪的任务和流程第114-116页
     ·CLTDT话题跟踪的任务第114-115页
     ·CLTDT话题跟踪的流程第115-116页
 第三节 CLTDT话题跟踪的方法第116-123页
     ·早期的话题跟踪方法第116页
     ·目前话题跟踪方法第116-122页
     ·对跨语言话题跟踪方法的改进策略第122-123页
 第四节 CLTDT话题跟踪实验第123-127页
     ·话题跟踪测试第123-124页
     ·时间序列上的话题演化趋势分析第124-127页
 本章小结第127-128页
第七章 余论第128-130页
 第一节 本研究的结论第128页
 第二节 本研究中存在的不足第128-130页
参考文献第130-136页
致谢第136-137页
攻读学位期间发表的学术论文目录第137页

论文共137页,点击 下载论文
上一篇:髓系细胞特异性Sptlc2基因缺失对小鼠动脉粥样硬化病灶的影响
下一篇:果亲王允礼收藏中的《密印授记请问经》研究