中文分词在农业垂直搜索引擎中的应用研究
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 第1章 绪论 | 第8-16页 |
| ·研究背景及意义 | 第8-10页 |
| ·国内外研究现状 | 第10-14页 |
| ·国内中文分词技术发展状况 | 第10-12页 |
| ·国外中文分词技术发展状况 | 第12-13页 |
| ·开源中文分词软件包 | 第13-14页 |
| ·论文的主要工作 | 第14页 |
| ·论文的组织结构 | 第14-16页 |
| 第2章 中文分词理论及方法 | 第16-24页 |
| ·中文分词方法 | 第16-19页 |
| ·基于词典的分词方法 | 第16-17页 |
| ·基于统计的分词方法 | 第17页 |
| ·基于理解的分词方法 | 第17-18页 |
| ·组合的分词方法 | 第18页 |
| ·由字构词的分词方法 | 第18-19页 |
| ·中文分词的关键问题 | 第19-21页 |
| ·分词歧义消解 | 第19-20页 |
| ·未登录词识别 | 第20-21页 |
| ·统计模型 | 第21-24页 |
| ·N 元语法模型 | 第21-22页 |
| ·隐马尔科夫模型 | 第22页 |
| ·最大熵模型 | 第22-24页 |
| 第3章 基于词典与统计的组合分词模型 | 第24-38页 |
| ·词典结构 | 第25-27页 |
| ·典型的词典结构 | 第25页 |
| ·词典结构设计 | 第25-27页 |
| ·粗分模型 | 第27-29页 |
| ·歧义消解 | 第29-30页 |
| ·未登录词识别 | 第30-38页 |
| ·对专业术语的识别 | 第30-34页 |
| ·对人名的识别 | 第34-36页 |
| ·对中文机构名的识别 | 第36-38页 |
| 第4章 原型系统的设计与实现 | 第38-54页 |
| ·系统设计 | 第38-40页 |
| ·设计原则 | 第38页 |
| ·功能设计 | 第38-40页 |
| ·系统实现 | 第40-49页 |
| ·分词预处理 | 第40-42页 |
| ·粗分与歧义识别 | 第42-45页 |
| ·歧义消解 | 第45-46页 |
| ·未登录词识别 | 第46-49页 |
| ·分词校正与输出 | 第49页 |
| ·系统测试 | 第49-54页 |
| ·实验环境及资源 | 第49-50页 |
| ·评测指标 | 第50-51页 |
| ·实验设计与结果分析 | 第51-54页 |
| 第5章 总结与展望 | 第54-55页 |
| ·总结 | 第54页 |
| ·展望 | 第54-55页 |
| 参考文献 | 第55-58页 |
| 致谢 | 第58-59页 |
| 作者简历 | 第59页 |