首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文报业出版的文字质量智能辅助控制技术研究

摘要第1-14页
Abstract第14-16页
第一章 绪论第16-27页
   ·研究背景第16-18页
   ·问题的提出第18-20页
   ·论文的研究思路第20-24页
   ·论文的主要工作及贡献第24-25页
   ·论文的组织结构第25-27页
第二章 相关研究工作现状第27-44页
   ·词汇的语义分类与短语识别第27-35页
     ·外文词汇的语义分类第27-30页
     ·汉语词汇的语义分类第30-32页
     ·情感词汇的自动分类第32-33页
     ·短语识别方法第33-35页
   ·句子和篇章级语义分析第35-40页
     ·有监督的语义角色标注第35-38页
     ·半监督和无监督的语义角色标注第38页
     ·篇章级意见挖掘研究现状第38-40页
   ·新事件检测与复制检测第40-44页
     ·新事件检测与复制检测的异同第40页
     ·新事件检测方法第40-42页
     ·文本复制检测方法第42-44页
第三章 文字质量智能辅助控制的概念和技术框架第44-51页
   ·文字质量智能辅助控制的相关概念第44-47页
   ·报业出版文字质量智能辅助控制的生产流程第47-49页
     ·报业出版文字质量智能辅助控制的概念及其内涵第47-48页
     ·报业出版文字质量智能辅助控制的生产流程第48-49页
   ·报业出版文字质量智能辅助控制技术框架第49-50页
     ·文字质量智能辅助控制系统技术框架第49-50页
     ·文字质量智能辅助控制的关键技术第50页
   ·本章小结第50-51页
第四章 面向文字查错的汉语实词和短语义类标记第51-86页
   ·构建面向文字查错的新闻语料库第51-53页
     ·分词标注新闻语料库的来源第51页
     ·以系统工程法标注分词新闻语料库第51-52页
     ·辅助的未分词语料库来源第52-53页
   ·面向文字查错的汉语实词语义分类第53-56页
     ·进行语义分类的目的第53页
     ·面向文字查错的词汇分类原则与理想分类第53-54页
     ·汉语实词分类与种子词的标记第54-56页
   ·汉语实词义类的自动获取第56-65页
     ·分类特征的选择第56-60页
     ·分类学习语料库的抽取第60-61页
     ·基于BootStrapping 的义类自动获取算法第61-64页
     ·低频词汇的义类自动获取第64-65页
   ·词义消歧与义类自动标注第65-74页
     ·面向义类的粗粒度词义消歧第65-67页
     ·条件随机场模型第67-72页
     ·词性与义类的联合标注第72-74页
   ·复合名词与名词短语的义类标注第74-78页
     ·复合名词的离线义类学习第74-75页
     ·基本名词短语的自动识别第75-78页
     ·基本名词短语义类识别第78页
   ·实验结果与讨论第78-85页
     ·实词义类的自动获取算法实验第78-81页
     ·词性与义类联合标注实验第81-83页
     ·名词短语识别实验第83-85页
   ·本章小结第85-86页
第五章 基于义类标记的新闻稿自动查错第86-123页
   ·新闻稿中的文字质量问题分析第86-88页
     ·字词错误第86页
     ·标点、数字与计量单位使用错误第86-87页
     ·语法错误第87页
     ·语义错误第87-88页
     ·前后不一致第88页
   ·利用基于义类的N-gram 模型查找局部错误第88-97页
     ·统计语言处理的N-gram 语言模型及其问题第88-94页
     ·基于类的n-gram 模型第94-95页
     ·利用基于义类的3-gram 模型的自动查错第95-97页
   ·基于语义优选的长距离查错第97-109页
     ·动词对主语和宾语的语义优选第97-101页
     ·针对的问题第101-102页
     ·基于半监督语义角色标注的主谓和动宾搭配提取策略第102-103页
     ·句子核心谓语动词的识别第103-108页
     ·基于语义优选的主谓和动宾搭配查错第108-109页
   ·基于点互信息的复句结构与标点查错第109-113页
     ·问题分析第109-110页
     ·熵与互信息第110-112页
     ·基于复句连词点互信息的复句结构与标点查错第112-113页
   ·人名-职务前后不一致检测第113-117页
     ·问题分析第113页
     ·基于小规模特征的人名识别第113-117页
     ·人名-职务前后不一致检查算法第117页
   ·实验结果与讨论第117-122页
     ·实验数据与评价指标第117-118页
     ·基于义类的Tri-gram 模型的查错性能实验第118-119页
     ·基于语义优选的查错算法性能实验第119-120页
     ·复句结构与标点查错实验第120-121页
     ·人名-职务的前后不一致检测实验第121-122页
   ·本章小结第122-123页
第六章 历史稿件话题内聚类与重稿检测第123-154页
   ·重稿检测问题分析第123-125页
     ·重稿问题描述第123页
     ·重稿检测与相关技术的区别第123-124页
     ·重稿检测算法流程第124-125页
   ·历史稿件分类组织与聚类第125-131页
     ·基于广义话题的稿件分类第125-128页
     ·历史稿件的话题内事件聚类第128-131页
   ·基于首段文字特征的新事件检测第131-140页
     ·首段内容的多语义类描述第131-135页
     ·改进的相似性度量第135-139页
     ·广义话题内新事件检测算法第139-140页
   ·基于全文特征的重稿检测第140-147页
     ·面向重稿检测的特征提取第140-142页
     ·话题内历史查重算法第142页
     ·新闻评论的意见识别及重稿检测第142-146页
     ·预见报稿件内查重第146-147页
   ·实验结果与讨论第147-153页
     ·基于首段文字特征的新事件检测实验第147-151页
     ·基于全文特征的重稿检测实验第151-152页
     ·新闻评论的重稿检测实验第152-153页
   ·本章小结第153-154页
第七章 结束语第154-157页
   ·论文的主要贡献第154-155页
   ·进一步的工作第155-157页
致谢第157-158页
参考文献第158-169页
作者在学期间取得的学术成果第169页

论文共169页,点击 下载论文
上一篇:场景图像内容表述和分类研究
下一篇:多变元网络数据可视化方法研究