中文报业出版的文字质量智能辅助控制技术研究

摘要	第1-14页
Abstract	第14-16页
第一章绪论	第16-27页
·研究背景	第16-18页
·问题的提出	第18-20页
·论文的研究思路	第20-24页
·论文的主要工作及贡献	第24-25页
·论文的组织结构	第25-27页
第二章相关研究工作现状	第27-44页
·词汇的语义分类与短语识别	第27-35页
·外文词汇的语义分类	第27-30页
·汉语词汇的语义分类	第30-32页
·情感词汇的自动分类	第32-33页
·短语识别方法	第33-35页
·句子和篇章级语义分析	第35-40页
·有监督的语义角色标注	第35-38页
·半监督和无监督的语义角色标注	第38页
·篇章级意见挖掘研究现状	第38-40页
·新事件检测与复制检测	第40-44页
·新事件检测与复制检测的异同	第40页
·新事件检测方法	第40-42页
·文本复制检测方法	第42-44页
第三章文字质量智能辅助控制的概念和技术框架	第44-51页
·文字质量智能辅助控制的相关概念	第44-47页
·报业出版文字质量智能辅助控制的生产流程	第47-49页
·报业出版文字质量智能辅助控制的概念及其内涵	第47-48页
·报业出版文字质量智能辅助控制的生产流程	第48-49页
·报业出版文字质量智能辅助控制技术框架	第49-50页
·文字质量智能辅助控制系统技术框架	第49-50页
·文字质量智能辅助控制的关键技术	第50页
·本章小结	第50-51页
第四章面向文字查错的汉语实词和短语义类标记	第51-86页
·构建面向文字查错的新闻语料库	第51-53页
·分词标注新闻语料库的来源	第51页
·以系统工程法标注分词新闻语料库	第51-52页
·辅助的未分词语料库来源	第52-53页
·面向文字查错的汉语实词语义分类	第53-56页
·进行语义分类的目的	第53页
·面向文字查错的词汇分类原则与理想分类	第53-54页
·汉语实词分类与种子词的标记	第54-56页
·汉语实词义类的自动获取	第56-65页
·分类特征的选择	第56-60页
·分类学习语料库的抽取	第60-61页
·基于BootStrapping 的义类自动获取算法	第61-64页
·低频词汇的义类自动获取	第64-65页
·词义消歧与义类自动标注	第65-74页
·面向义类的粗粒度词义消歧	第65-67页
·条件随机场模型	第67-72页
·词性与义类的联合标注	第72-74页
·复合名词与名词短语的义类标注	第74-78页
·复合名词的离线义类学习	第74-75页
·基本名词短语的自动识别	第75-78页
·基本名词短语义类识别	第78页
·实验结果与讨论	第78-85页
·实词义类的自动获取算法实验	第78-81页
·词性与义类联合标注实验	第81-83页
·名词短语识别实验	第83-85页
·本章小结	第85-86页
第五章基于义类标记的新闻稿自动查错	第86-123页
·新闻稿中的文字质量问题分析	第86-88页
·字词错误	第86页
·标点、数字与计量单位使用错误	第86-87页
·语法错误	第87页
·语义错误	第87-88页
·前后不一致	第88页
·利用基于义类的N-gram 模型查找局部错误	第88-97页
·统计语言处理的N-gram 语言模型及其问题	第88-94页
·基于类的n-gram 模型	第94-95页
·利用基于义类的3-gram 模型的自动查错	第95-97页
·基于语义优选的长距离查错	第97-109页
·动词对主语和宾语的语义优选	第97-101页
·针对的问题	第101-102页
·基于半监督语义角色标注的主谓和动宾搭配提取策略	第102-103页
·句子核心谓语动词的识别	第103-108页
·基于语义优选的主谓和动宾搭配查错	第108-109页
·基于点互信息的复句结构与标点查错	第109-113页
·问题分析	第109-110页
·熵与互信息	第110-112页
·基于复句连词点互信息的复句结构与标点查错	第112-113页
·人名-职务前后不一致检测	第113-117页
·问题分析	第113页
·基于小规模特征的人名识别	第113-117页
·人名-职务前后不一致检查算法	第117页
·实验结果与讨论	第117-122页
·实验数据与评价指标	第117-118页
·基于义类的Tri-gram 模型的查错性能实验	第118-119页
·基于语义优选的查错算法性能实验	第119-120页
·复句结构与标点查错实验	第120-121页
·人名-职务的前后不一致检测实验	第121-122页
·本章小结	第122-123页
第六章历史稿件话题内聚类与重稿检测	第123-154页
·重稿检测问题分析	第123-125页
·重稿问题描述	第123页
·重稿检测与相关技术的区别	第123-124页
·重稿检测算法流程	第124-125页
·历史稿件分类组织与聚类	第125-131页
·基于广义话题的稿件分类	第125-128页
·历史稿件的话题内事件聚类	第128-131页
·基于首段文字特征的新事件检测	第131-140页
·首段内容的多语义类描述	第131-135页
·改进的相似性度量	第135-139页
·广义话题内新事件检测算法	第139-140页
·基于全文特征的重稿检测	第140-147页
·面向重稿检测的特征提取	第140-142页
·话题内历史查重算法	第142页
·新闻评论的意见识别及重稿检测	第142-146页
·预见报稿件内查重	第146-147页
·实验结果与讨论	第147-153页
·基于首段文字特征的新事件检测实验	第147-151页
·基于全文特征的重稿检测实验	第151-152页
·新闻评论的重稿检测实验	第152-153页
·本章小结	第153-154页
第七章结束语	第154-157页
·论文的主要贡献	第154-155页
·进一步的工作	第155-157页
致谢	第157-158页
参考文献	第158-169页
作者在学期间取得的学术成果	第169页