首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

语言浅层分析与句子级新信息检测研究

摘要第1-5页
Abstract第5-7页
目录第7-11页
图目录第11-13页
表目录第13-14页
第一章 引言第14-27页
   ·句子级新信息检测产生的背景第14-19页
     ·信息增长的现状与需求特点第14-15页
     ·文档级信息检索技术第15-17页
     ·自动问答系统第17-18页
     ·句子级新信息检测第18-19页
   ·Noovel系统的总体架构第19-21页
     ·已知信息第19-21页
     ·子任务第21页
   ·新信息检测的相关技术第21-23页
     ·信息检索第21-22页
     ·信息过滤第22页
     ·文本分类第22页
     ·自动文摘第22页
     ·自然语言理解第22-23页
   ·评测方法与测试平台第23-25页
     ·发展历程第23-24页
     ·评价方法第24-25页
     ·测试数据集第25页
   ·论文的组织结构第25-27页
第二章 句子检索与新信息检测的主要算法模型第27-37页
   ·概述第27-28页
   ·句子检索方法综述第28-32页
     ·传统的文档检索方法第28-29页
     ·信息过滤方法第29页
     ·分类方法第29-30页
     ·语义比较方法第30-31页
     ·隐马模型(HMM)方法第31-32页
     ·自动文摘方法第32页
   ·新信息检测方法综述第32-35页
     ·词重叠度第33页
     ·最大区间相关度(Maximum Marginal Relevance)第33页
     ·Cosine冗余度第33页
     ·命名实体触发方法第33-34页
     ·统计机器翻译模型第34-35页
     ·LexRank方法第35页
   ·本章小结第35-37页
第三章 Noovel特定的浅层语言分析第37-66页
   ·自然语言的特点与语言计算分析第37-40页
     ·自然语言的特点第37-38页
     ·自然语言的计算分析第38-39页
     ·自然语言分析的不同层次知识第39-40页
   ·新信息检测与浅层语言分析第40-41页
   ·英文浅层分析第41-46页
     ·英文断句(Sentence Boundary Detection)与词汇切分(Tokenization)第41-43页
     ·词性标注(Part-Of-Speech Tagging)第43-45页
     ·词干抽取(Stemming)与词形还原(Morphplogical Normalization)第45-46页
   ·停用词处理与特征选择第46-49页
     ·停用词处理第47页
     ·特征选择第47-48页
     ·浅层语言分析的中间结果第48-49页
   ·查询分析第49-51页
   ·汉语浅层分析与ICTCLAS第51-64页
     ·层次隐马模型和汉语浅层语言分析第53-56页
     ·基于类的隐马分词算法第56-57页
     ·N-最短路径的切分排歧策略第57-59页
     ·未登录词的隐马识别方法第59-61页
     ·实验与分析第61-64页
   ·本章小结第64-66页
第四章 Noovel句子检索算法与分析第66-85页
   ·概述第66页
   ·向量空间模型及其扩展第66-75页
     ·向量空间模型基本思想第67页
     ·向量空间表示法第67-68页
     ·查询相关性计算第68页
     ·特征权重估计与规格化第68-70页
     ·句子检索的查询扩展第70-75页
   ·概率检索模型第75-76页
   ·语言模型检索(Language Modeling IR)第76-78页
     ·语言模型的基本思想第76-78页
     ·句子级语言模型的改进第78页
   ·句子检索实验与分析第78-83页
     ·浅层语言分析的贡献度实验第78-80页
     ·三种句子检索模型的基准实验第80-82页
     ·查询扩展实验第82-83页
   ·本章小结第83-85页
第五章 Noovel新信息检测技术第85-93页
   ·概述第85页
   ·词重叠度及其扩展(Word Overlapping)第85-87页
     ·基于词重叠度的句子新颖度计算第85-86页
     ·带权重的词重叠度计算第86-87页
   ·相似度比较方法(Similarity Margin)第87页
   ·信息增强评价方法(Information Increment)第87-88页
   ·其他方法第88-91页
     ·语言模型(Language Model)第88-89页
     ·句子语义距离计算方法(Sentence Semantic Distance)第89-91页
   ·新信息检测试验与分析第91-92页
   ·本章小结第92-93页
第六章 监督学习条件下的句子检索与新信息检测第93-100页
   ·概述第93-94页
   ·监督学习环境下的参数调整与阈值设置第94-96页
   ·基于分类的句子检索与新信息检测方法第96-98页
   ·实验与分析第98-99页
     ·监督实验一第98页
     ·监督实验二第98-99页
   ·本章小结第99-100页
第七章 Noovel系统在TREC2004新信息检测任务中的公开评测第100-108页
   ·概述第100-101页
   ·任务1测试结果与对比第101-103页
   ·任务2测试结果与对比第103-104页
   ·任务3测试结果与对比第104-105页
   ·任务4测试结果与对比第105-106页
   ·本章小结第106-108页
第八章 结束语第108-113页
   ·本文主要贡献与创新第108-109页
   ·下一步研究方向第109-110页
   ·前景与展望第110-113页
     ·可排重、更精细的信息检索与过滤平台第110-111页
     ·可订制的新闻摘要(Customized News Abstraction;CNA)第111页
     ·新信息检测辅助阅读器(Noovel Aided Reader;NAR)第111-113页
附录1.TREC 2004 Novelty Track Guidelines第113-118页
 Summary第113页
 Goal第113-114页
 Tasks第114页
 Topics and Documents第114-115页
 Task and training data restrictions第115页
 Format of results第115-116页
 Evaluation第116-117页
 Definition for new and relevant第117-118页
附录2.Penn Treebank Tagset第118-119页
参考文献第119-129页
致谢第129-131页
作者简历第131-133页

论文共133页,点击 下载论文
上一篇:遥感卫星地面系统中数据管理的若干关键技术的研究
下一篇:数字版权技术措施的法律问题研究