面向专利文献的中文分词技术的研究

摘要	第1-7页
Abstract	第7-11页
第1章绪论	第11-15页
·课题的提出	第11-12页
·本文的研究意义	第12-13页
·本文的主要工作	第13-14页
·本文的结构安排	第14-15页
第2章相关研究方法概述	第15-25页
·汉语自动分词的难点	第15-18页
·分词规范问题	第15-17页
·歧义切分问题	第17页
·未登录词识别问题	第17-18页
·现有研究方法	第18-21页
·基于词典的方法	第18-19页
·基于统计的方法	第19-20页
·基于字标注的方法	第20-21页
·统计语言模型的理论介绍	第21-24页
·N 元文法统计模型	第22-23页
·条件随机场模型	第23-24页
·本章小结	第24-25页
第3章统计和规则相结合的分词技术研究	第25-34页
·专利文献分析	第25-28页
·面向专利文献分词的标准	第25-26页
·专利文献的特点和自动切分的难点分析	第26-27页
·专利术语多层次切分	第27-28页
·基于统计和规则相结合的分词技术	第28-33页
·基于规则的预处理模型	第29-30页
·统计上下文信息模型	第30-31页
·统计语言模型	第31-32页
·后处理	第32-33页
·本章小结	第33-34页
第4章基于条件随机场的分词方法研究	第34-39页
·基于字的条件随机场模型的分词研究	第34-37页
·标注集	第35页
·特征模板	第35-36页
·特征的选择	第36-37页
·基于字词混合的条件随机场模型的分词研究	第37-38页
·基于字的模型中存在的问题	第37页
·融入无监督分词信息	第37-38页
·基于字和词的标注框架	第38页
·本章小结	第38-39页
第5章系统设计及实现	第39-49页
·系统设计及实现	第39-44页
·专利分词系统的设计	第39-40页
·基于统计和规则相结合分词模块	第40-41页
·基于条件随机场的分词模块	第41-44页
·实验结果分析	第44-48页
·评测方法	第44页
·实验语料	第44页
·结果及分析	第44-48页
·本章小结	第48-49页
结论	第49-51页
附录I 专利文献的切分规范	第51-53页
参考文献	第53-56页
致谢	第56-58页
攻读硕士期间发表（含录用）的学术论文及科研成果	第58页