| 中文摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第一章 绪论 | 第10-15页 |
| ·研究背景和意义 | 第10-12页 |
| ·国内外研究现状 | 第12-13页 |
| ·本文主要研究内容 | 第13页 |
| ·本文的组织结构 | 第13-15页 |
| 第二章 相关知识 | 第15-25页 |
| ·逗号分类相关知识 | 第15-17页 |
| ·组块分析 | 第15-16页 |
| ·句子边界识别 | 第16-17页 |
| ·语篇结构相关知识 | 第17-18页 |
| ·基本语篇单元识别 | 第17-18页 |
| ·相关机器学习方法 | 第18-22页 |
| ·熵 | 第18-19页 |
| ·最大熵模型 | 第19-21页 |
| ·整数线性规划 | 第21-22页 |
| ·评测标准 | 第22-24页 |
| ·语料库一致性分析 | 第22-23页 |
| ·分类评测 | 第23-24页 |
| ·本章小结 | 第24-25页 |
| 第三章 逗号分类语料库标注方法 | 第25-37页 |
| ·逗号标注语料库情况 | 第25-26页 |
| ·两类逗号标注 | 第26-28页 |
| ·两类逗号分类标准 | 第26-27页 |
| ·两类逗号的标注方法 | 第27-28页 |
| ·多类逗号标注 | 第28-35页 |
| ·多类逗号分类标准 | 第29-34页 |
| ·多类逗号自动标注方法 | 第34-35页 |
| ·语料库 Kappa 值计算 | 第35-36页 |
| ·本章小结 | 第36-37页 |
| 第四章 基于层次结构的逗号分类方法 | 第37-48页 |
| ·基准系统概述 | 第37-38页 |
| ·基于层次结构的中文分句模型概述 | 第38-42页 |
| ·层次结构模型 | 第38-39页 |
| ·特征向量选择及实例生成 | 第39-42页 |
| ·实验结果及分析 | 第42-47页 |
| ·语料标注及实验设置 | 第42页 |
| ·第一层 ME 分类器性能分析 | 第42-44页 |
| ·第二层 ME 分类器性能分析 | 第44-47页 |
| ·本章小结 | 第47-48页 |
| 第五章 基于逗号的基本语篇单元分类及优化方法 | 第48-63页 |
| ·基于 ME 模型的基本语篇单元识别模型 | 第48-54页 |
| ·适合多类逗号的句法特征抽取 | 第48-52页 |
| ·实验结果及分析 | 第52-54页 |
| ·基于 CRF 模型的基本语篇单元识别模型 | 第54-57页 |
| ·特征模板的构建 | 第55页 |
| ·实验结果及分析 | 第55-57页 |
| ·基于 CRF 模型与 ME 模型相结合的基本语篇单元识别模型 | 第57-62页 |
| ·整数线性规划的约束条件 | 第57-60页 |
| ·实验结果及分析 | 第60-62页 |
| ·本章小结 | 第62-63页 |
| 第六章 总结与展望 | 第63-65页 |
| ·研究工作总结 | 第63页 |
| ·展望 | 第63-65页 |
| 参考文献 | 第65-69页 |
| 攻读学位期间科研情况说明 | 第69-70页 |
| 致谢 | 第70-71页 |