| 摘要 | 第1-6页 |
| Abstract | 第6-11页 |
| 第1章 绪论 | 第11-31页 |
| ·研究背景及意义 | 第11页 |
| ·国内外研究现状 | 第11-20页 |
| ·机械+规则方法 | 第11-13页 |
| ·统计方法 | 第13-20页 |
| ·关键问题 | 第20-22页 |
| ·歧义切分 | 第20-21页 |
| ·未登录词 | 第21-22页 |
| ·语料资源 | 第22-24页 |
| ·常用语料资源 | 第22-23页 |
| ·语料中存在的问题 | 第23-24页 |
| ·评测 | 第24-28页 |
| ·测试类型 | 第25页 |
| ·评价指标 | 第25-26页 |
| ·评测数据 | 第26-27页 |
| ·评测小结 | 第27-28页 |
| ·常用中文分词工具 | 第28-29页 |
| ·研究内容及安排 | 第29-31页 |
| 第2章 字序列标注分词方法调研 | 第31-43页 |
| ·机器学习模型 | 第31-37页 |
| ·生成模型与判别模型 | 第31-32页 |
| ·中文分词常用模型对比 | 第32-37页 |
| ·特征选择对分词结果的影响 | 第37-40页 |
| ·实验语料 | 第38页 |
| ·特征模板与标注集合 | 第38-39页 |
| ·实验结果及分析 | 第39-40页 |
| ·本章小结 | 第40-43页 |
| 第3章 基于“固结词串”的普通领域分词歧义消解 | 第43-53页 |
| ·基于 CRF 模型中文分词方法存在的问题 | 第43-45页 |
| ·固结词串 | 第45-46页 |
| ·固结词 | 第46页 |
| ·分词策略 | 第46-47页 |
| ·实验 | 第47-51页 |
| ·实验语料与设置 | 第47-49页 |
| ·实验结果与分析 | 第49-51页 |
| ·CRF 与固结词串结合 | 第51页 |
| ·本章小结 | 第51-53页 |
| 第4章 语料特征适合度 | 第53-69页 |
| ·OOV 的质 | 第53-54页 |
| ·基本元素特征适合度 | 第54-55页 |
| ·总体特征适合度和相对适合度 | 第55-56页 |
| ·总体对称特征适合度 | 第55页 |
| ·总体相对特征适合度 | 第55-56页 |
| ·使用方式 | 第56页 |
| ·实验语料与设置 | 第56-59页 |
| ·基础语料 | 第56-57页 |
| ·语料扩展 | 第57-58页 |
| ·实验设置 | 第58-59页 |
| ·实验结果与分析 | 第59-67页 |
| ·单一训练语料 | 第59-61页 |
| ·平衡训练语料 | 第61-67页 |
| ·基于机器学习的中文分方法的局限性 | 第67页 |
| ·本章小结 | 第67-69页 |
| 第5章 语料规模对分词结果的影响 | 第69-101页 |
| ·统一 OOV 与分词歧义比率测量方法 | 第69-71页 |
| ·测试语料规模对分词结果的影响 | 第71-81页 |
| ·实验语料与设置 | 第71-73页 |
| ·实验结果与分析 | 第73-81页 |
| ·训练语料规模对分词结果的影响 | 第81-88页 |
| ·非同质训练语料 | 第81-82页 |
| ·同质训练语料 | 第82-88页 |
| ·OOV 与分词歧义的关系及影响 | 第88-99页 |
| ·词表的重要性 | 第88-89页 |
| ·词表的获取优势 | 第89页 |
| ·词表扩充对 OOV 与分词歧义的影响 | 第89-99页 |
| ·本章小结 | 第99-101页 |
| 第6章 词表与统计结合的专业领域 OOV 识别方法 | 第101-121页 |
| ·专业领域分词相关工作 | 第101-102页 |
| ·实验语料 | 第102-103页 |
| ·词表与 CRF 方法相结合 | 第103-114页 |
| ·训练语料候选句子评价标准 | 第104页 |
| ·字符串分类 | 第104-107页 |
| ·基于子串的分词方法 | 第107-109页 |
| ·新词过滤与后处理 | 第109-110页 |
| ·实验设置与结果分析 | 第110-114页 |
| ·词表与 NVBE 方法相结合 | 第114-120页 |
| ·无监督学习方法考察 | 第115-116页 |
| ·结合方式 | 第116-117页 |
| ·实验设置及结果分析 | 第117-120页 |
| ·本章小结 | 第120-121页 |
| 第7章 无监督专业领域分词歧义消解方法 | 第121-133页 |
| ·专业领域分词歧义分析 | 第121-123页 |
| ·专业领域分词歧义与通用领域分词歧义区别 | 第121-122页 |
| ·专业领域分词歧义主要解决的问题 | 第122-123页 |
| ·最大交搭歧义链的选择 | 第123页 |
| ·无监督的专业领域分词歧义消解方法 | 第123-127页 |
| ·字符串频次 | 第124-125页 |
| ·互信息 | 第125页 |
| ·边界熵 | 第125-127页 |
| ·实验 | 第127-132页 |
| ·实验语料与设置 | 第127-128页 |
| ·实验结果与分析 | 第128-132页 |
| ·本章小结 | 第132-133页 |
| 结论 | 第133-137页 |
| 参考文献 | 第137-147页 |
| 攻读博士学位期间发表的学术论文 | 第147-148页 |
| 致谢 | 第148-149页 |