中文分词系统的设计和实现
摘要 | 第1-5页 |
Abstract | 第5-10页 |
第一章 绪论 | 第10-15页 |
·中文分词技术的研究背景和意义 | 第10-11页 |
·中文分词技术的研究现状 | 第11-13页 |
·中文分词技术的研究难点 | 第13页 |
·本文的主要工作 | 第13-15页 |
第二章 中文分词处理技术的研究 | 第15-25页 |
·基于字典直接匹配的分词方法 | 第15-18页 |
·最大匹配算法 | 第15-17页 |
·最少词切分方法 | 第17页 |
·N-最短路径法 | 第17-18页 |
·基于统计模型的分词算法 | 第18-25页 |
·基于N-Gram 的中文分词方法 | 第18-22页 |
·基于N-最短路径的统计粗分模型 | 第22-25页 |
第三章 中文人名识别现状和算法 | 第25-41页 |
·中文人名分词的特点 | 第25-27页 |
·中文人名识别的难点 | 第27-28页 |
·中文人名识别的现有解决办法 | 第28-29页 |
·基于角色标注的中文人名识别办法 | 第29-41页 |
·马尔科夫模型 | 第30-31页 |
·隐马尔科夫模型(HMM) | 第31-36页 |
·中文人名的构成角色 | 第36-37页 |
·中文人名的角色标注与识别 | 第37-40页 |
·角色信息的数据训练 | 第40-41页 |
第四章 中文分词系统的设计和实现 | 第41-59页 |
·系统设计与原则 | 第41-42页 |
·中文分词系统的设计 | 第42-43页 |
·预处理模块 | 第43-45页 |
·文档格式转换 | 第44页 |
·文本断句/原子切分 | 第44页 |
·简单英文单词纠错 | 第44-45页 |
·中文分词模块 | 第45-51页 |
·基于整词二分法的中文词典 | 第45-47页 |
·中文的分词任务的实现 | 第47-49页 |
·中文分词模块的模型求解 | 第49-51页 |
·中文人名识别模块 | 第51-55页 |
·基于Trie 树的中文词典 | 第51-54页 |
·中文人名识别模块 | 第54-55页 |
·系统设计模式的选取 | 第55-59页 |
第五章 实验及结果分析 | 第59-66页 |
·实验评价标准 | 第59-61页 |
·中文分词模块实验 | 第61-63页 |
·人名识别模块实验 | 第63-66页 |
第六章 总结与展望 | 第66-68页 |
·本文总结 | 第66-67页 |
·未来展望 | 第67-68页 |
致谢 | 第68-69页 |
参考文献 | 第69-72页 |
个人简历 | 第72页 |
攻读硕士研究生期间完成的工作 | 第72页 |
研究生期间发表学术论文 | 第72-73页 |