首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文词法分析技术的研究与实现

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-20页
   ·课题背景第10-11页
     ·中文分词研究的意义第10-11页
     ·词性标注和动词细分类研究的意义第11页
   ·词法分析的主要问题和方法及研究现状概述第11-14页
     ·中文分词的主要问题和方法概述第11-13页
     ·词性标注的主要问题和方法概述第13-14页
     ·动词细分类的研究现状概述第14页
   ·SIGHAN Segmentation Bakeoff 2005 中分词方法评述第14-18页
   ·本文的结构第18-19页
   ·本章小结第19-20页
第2章 基于词类的分词概率模型第20-26页
   ·语言模型第20-23页
     ·统计语言模型介绍第20页
     ·信源信道模型与统计语言模型第20-21页
     ·N-gram模型第21-22页
     ·数据平滑第22-23页
   ·基于词类的分词概率模型第23-25页
     ·模型的理论推导第23-24页
     ·词类的定义第24-25页
   ·本章小结第25-26页
第3章 基于角色标注的未登录词识别第26-39页
   ·隐马尔科夫模型第26-29页
     ·隐马尔科夫模型的定义第26-27页
     ·Viterbi算法第27-29页
   ·未登录词识别的主要难点第29-31页
     ·未登录词与命名实体第29-30页
     ·未登录词识别的主要难点第30-31页
   ·角色的定义及角色语料库第31-34页
     ·角色的定义第31-33页
     ·角色语料库第33-34页
   ·基于角色标注的未登录词识别第34-38页
     ·角色标注的隐马尔科夫模型参数的训练第34-35页
     ·利用Viterbi算法进行角色标注第35-37页
     ·未登录词概率的计算第37-38页
   ·本章小结第38-39页
第4章 词性标注与动词细分类研究第39-48页
   ·词性标注第39-41页
     ·词性标记集第39-40页
     ·基于隐马尔科夫模型的词性标注第40-41页
   ·动词细分类第41-47页
     ·动词细分类标注规范第41-42页
     ·基于改进隐马尔科夫模型的动词细分类第42-43页
     ·基于最大熵模型的动词细分类第43-45页
     ·动词细分类对比实验及其对句法分析的影响第45-47页
   ·本章小结第47-48页
第5章 IR词法分析系统(IRLAS)的设计与实现第48-59页
   ·IRLAS介绍第48-49页
   ·IRLAS的流程与结构设计第49-54页
     ·切分词图介绍第49-51页
     ·系统流程及各模块介绍第51-52页
     ·系统结构设计第52-54页
   ·实验与结果分析第54-58页
     ·分词与词性标注评测方法第54页
     ·在2000 年1 月人民日报语料上的实验第54-56页
     ·在SIGHAN Segmentation Bakeoff 2005 PKU语料上的实验第56-58页
   ·本章小结第58-59页
结论第59-60页
参考文献第60-65页
附录1 词法分析系统(IRLAS)在线演示及源代码共享情况介绍第65-67页
附录2 第二届国际SIGHAN分词评测及IRLAS参赛情况介绍第67-69页
附录3 词法分析系统(IRLAS)技术转让列表第69-70页
附录4 信息检索研究室动词细分类标注规范第70-74页
附录5 攻读硕士期间参与的研究与开发项目第74-75页
攻读学位期间发表的学术论文第75-76页
哈尔滨工业大学硕士学位论文原创性声明第76页
哈尔滨工业大学硕士学位论文使用授权书第76页
哈尔滨工业大学硕士学位涉密论文管理第76-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:快速压缩机的开发及其在HCCI燃烧研究中的应用
下一篇:寒冷地区汽车预热器的研究