| 摘要 | 第1-14页 |
| Abstract | 第14-16页 |
| 第一章 绪论 | 第16-27页 |
| ·研究背景 | 第16-18页 |
| ·问题的提出 | 第18-20页 |
| ·论文的研究思路 | 第20-24页 |
| ·论文的主要工作及贡献 | 第24-25页 |
| ·论文的组织结构 | 第25-27页 |
| 第二章 相关研究工作现状 | 第27-44页 |
| ·词汇的语义分类与短语识别 | 第27-35页 |
| ·外文词汇的语义分类 | 第27-30页 |
| ·汉语词汇的语义分类 | 第30-32页 |
| ·情感词汇的自动分类 | 第32-33页 |
| ·短语识别方法 | 第33-35页 |
| ·句子和篇章级语义分析 | 第35-40页 |
| ·有监督的语义角色标注 | 第35-38页 |
| ·半监督和无监督的语义角色标注 | 第38页 |
| ·篇章级意见挖掘研究现状 | 第38-40页 |
| ·新事件检测与复制检测 | 第40-44页 |
| ·新事件检测与复制检测的异同 | 第40页 |
| ·新事件检测方法 | 第40-42页 |
| ·文本复制检测方法 | 第42-44页 |
| 第三章 文字质量智能辅助控制的概念和技术框架 | 第44-51页 |
| ·文字质量智能辅助控制的相关概念 | 第44-47页 |
| ·报业出版文字质量智能辅助控制的生产流程 | 第47-49页 |
| ·报业出版文字质量智能辅助控制的概念及其内涵 | 第47-48页 |
| ·报业出版文字质量智能辅助控制的生产流程 | 第48-49页 |
| ·报业出版文字质量智能辅助控制技术框架 | 第49-50页 |
| ·文字质量智能辅助控制系统技术框架 | 第49-50页 |
| ·文字质量智能辅助控制的关键技术 | 第50页 |
| ·本章小结 | 第50-51页 |
| 第四章 面向文字查错的汉语实词和短语义类标记 | 第51-86页 |
| ·构建面向文字查错的新闻语料库 | 第51-53页 |
| ·分词标注新闻语料库的来源 | 第51页 |
| ·以系统工程法标注分词新闻语料库 | 第51-52页 |
| ·辅助的未分词语料库来源 | 第52-53页 |
| ·面向文字查错的汉语实词语义分类 | 第53-56页 |
| ·进行语义分类的目的 | 第53页 |
| ·面向文字查错的词汇分类原则与理想分类 | 第53-54页 |
| ·汉语实词分类与种子词的标记 | 第54-56页 |
| ·汉语实词义类的自动获取 | 第56-65页 |
| ·分类特征的选择 | 第56-60页 |
| ·分类学习语料库的抽取 | 第60-61页 |
| ·基于BootStrapping 的义类自动获取算法 | 第61-64页 |
| ·低频词汇的义类自动获取 | 第64-65页 |
| ·词义消歧与义类自动标注 | 第65-74页 |
| ·面向义类的粗粒度词义消歧 | 第65-67页 |
| ·条件随机场模型 | 第67-72页 |
| ·词性与义类的联合标注 | 第72-74页 |
| ·复合名词与名词短语的义类标注 | 第74-78页 |
| ·复合名词的离线义类学习 | 第74-75页 |
| ·基本名词短语的自动识别 | 第75-78页 |
| ·基本名词短语义类识别 | 第78页 |
| ·实验结果与讨论 | 第78-85页 |
| ·实词义类的自动获取算法实验 | 第78-81页 |
| ·词性与义类联合标注实验 | 第81-83页 |
| ·名词短语识别实验 | 第83-85页 |
| ·本章小结 | 第85-86页 |
| 第五章 基于义类标记的新闻稿自动查错 | 第86-123页 |
| ·新闻稿中的文字质量问题分析 | 第86-88页 |
| ·字词错误 | 第86页 |
| ·标点、数字与计量单位使用错误 | 第86-87页 |
| ·语法错误 | 第87页 |
| ·语义错误 | 第87-88页 |
| ·前后不一致 | 第88页 |
| ·利用基于义类的N-gram 模型查找局部错误 | 第88-97页 |
| ·统计语言处理的N-gram 语言模型及其问题 | 第88-94页 |
| ·基于类的n-gram 模型 | 第94-95页 |
| ·利用基于义类的3-gram 模型的自动查错 | 第95-97页 |
| ·基于语义优选的长距离查错 | 第97-109页 |
| ·动词对主语和宾语的语义优选 | 第97-101页 |
| ·针对的问题 | 第101-102页 |
| ·基于半监督语义角色标注的主谓和动宾搭配提取策略 | 第102-103页 |
| ·句子核心谓语动词的识别 | 第103-108页 |
| ·基于语义优选的主谓和动宾搭配查错 | 第108-109页 |
| ·基于点互信息的复句结构与标点查错 | 第109-113页 |
| ·问题分析 | 第109-110页 |
| ·熵与互信息 | 第110-112页 |
| ·基于复句连词点互信息的复句结构与标点查错 | 第112-113页 |
| ·人名-职务前后不一致检测 | 第113-117页 |
| ·问题分析 | 第113页 |
| ·基于小规模特征的人名识别 | 第113-117页 |
| ·人名-职务前后不一致检查算法 | 第117页 |
| ·实验结果与讨论 | 第117-122页 |
| ·实验数据与评价指标 | 第117-118页 |
| ·基于义类的Tri-gram 模型的查错性能实验 | 第118-119页 |
| ·基于语义优选的查错算法性能实验 | 第119-120页 |
| ·复句结构与标点查错实验 | 第120-121页 |
| ·人名-职务的前后不一致检测实验 | 第121-122页 |
| ·本章小结 | 第122-123页 |
| 第六章 历史稿件话题内聚类与重稿检测 | 第123-154页 |
| ·重稿检测问题分析 | 第123-125页 |
| ·重稿问题描述 | 第123页 |
| ·重稿检测与相关技术的区别 | 第123-124页 |
| ·重稿检测算法流程 | 第124-125页 |
| ·历史稿件分类组织与聚类 | 第125-131页 |
| ·基于广义话题的稿件分类 | 第125-128页 |
| ·历史稿件的话题内事件聚类 | 第128-131页 |
| ·基于首段文字特征的新事件检测 | 第131-140页 |
| ·首段内容的多语义类描述 | 第131-135页 |
| ·改进的相似性度量 | 第135-139页 |
| ·广义话题内新事件检测算法 | 第139-140页 |
| ·基于全文特征的重稿检测 | 第140-147页 |
| ·面向重稿检测的特征提取 | 第140-142页 |
| ·话题内历史查重算法 | 第142页 |
| ·新闻评论的意见识别及重稿检测 | 第142-146页 |
| ·预见报稿件内查重 | 第146-147页 |
| ·实验结果与讨论 | 第147-153页 |
| ·基于首段文字特征的新事件检测实验 | 第147-151页 |
| ·基于全文特征的重稿检测实验 | 第151-152页 |
| ·新闻评论的重稿检测实验 | 第152-153页 |
| ·本章小结 | 第153-154页 |
| 第七章 结束语 | 第154-157页 |
| ·论文的主要贡献 | 第154-155页 |
| ·进一步的工作 | 第155-157页 |
| 致谢 | 第157-158页 |
| 参考文献 | 第158-169页 |
| 作者在学期间取得的学术成果 | 第169页 |