摘要 | 第1-6页 |
Abstract | 第6-13页 |
第1章 绪论 | 第13-21页 |
·研究背景和意义 | 第13-14页 |
·国内外研究现状 | 第14-15页 |
·相关理论和技术 | 第15-18页 |
·中文自动分词技术 | 第15-16页 |
·命名实体识别 | 第16-17页 |
·搜索引擎技术 | 第17-18页 |
·研究内容和创新点 | 第18-19页 |
·主要研究内容 | 第18页 |
·论文创新点 | 第18-19页 |
·论文整体结构 | 第19-21页 |
第2章 中文自动分词方法研究 | 第21-29页 |
·中文自动分词及其评价标准 | 第21-22页 |
·中文自动分词 | 第21页 |
·中文自动分词评价标准 | 第21-22页 |
·中文自动分词方法介绍 | 第22-27页 |
·基于分词词典的方法 | 第22-24页 |
·基于概率统计的方法 | 第24-26页 |
·基于知识推理的方法 | 第26-27页 |
·中文自动分词方法的比较与分析 | 第27页 |
·本章小结 | 第27-29页 |
第3章 中文自动分词词典研究 | 第29-38页 |
·自动分词词典的特点 | 第29-30页 |
·常见中文自动分词词典机制的介绍 | 第30-35页 |
·基于整词二分的自动分词词典机制 | 第30-31页 |
·基于 Trie 索引树的自动分词词典机制 | 第31-33页 |
·基于逐字二分的自动分词词典机制 | 第33-34页 |
·基于 PATRICIA 树的自动分词词典机制 | 第34-35页 |
·基于多哈希平衡二叉查找树的分词词典机制 | 第35-36页 |
·本章小结 | 第36-38页 |
第4章 中文自动分词难点研究 | 第38-47页 |
·中文自动分词的分词规范 | 第38-39页 |
·制定分词规范的目的和意义 | 第38页 |
·典型的分词规范的介绍 | 第38-39页 |
·中文自动分词的切分歧义处理 | 第39-40页 |
·中文自动分词的命名实体识别 | 第40-45页 |
·一种简单的分阶段的中文人名识别方法 | 第41-44页 |
·中文地名和机构名的识别 | 第44-45页 |
·本章小结 | 第45-47页 |
第5章 基于 CRF 和规则的中文医疗机构名称识别 | 第47-57页 |
·中文医疗机构名称分析 | 第47-50页 |
·内部语义结构分析 | 第47-49页 |
·外部上下文特征分析 | 第49-50页 |
·中文医疗机构名称识别 | 第50-53页 |
·基于条件随机场的中文医疗机构名识别 | 第50-51页 |
·CRF 模型中的特征模板的选择 | 第51-52页 |
·训练语料的处理 | 第52页 |
·CRF 模型训练过程 | 第52-53页 |
·验证规则 | 第53页 |
·中文医疗机构名称识别的实验结果与分析 | 第53-54页 |
·实验环境和结果 | 第53-54页 |
·错误分析 | 第54页 |
·本章小结 | 第54-57页 |
第6章 中文自动分词技术在中文搜索引擎中的应用 | 第57-63页 |
·搜索引擎简介 | 第57-58页 |
·自动分词和搜索引擎的关系 | 第58-60页 |
·自动分词在搜索引擎中的具体应用 | 第60-61页 |
·自动分词技术在搜索引擎网页搜索阶段的应用 | 第60页 |
·自动分词技术在搜索引擎预处理阶段的应用 | 第60-61页 |
·自动分词技术在搜索引擎查询处理阶段的应用 | 第61页 |
·自动分词技术在搜索引擎用户分析阶段的应用 | 第61页 |
·本章小结 | 第61-63页 |
总结与展望 | 第63-65页 |
本文总结 | 第63页 |
对未来工作的展望 | 第63-65页 |
参考文献 | 第65-68页 |
攻读硕士学位期间发表的论文 | 第68-69页 |
致谢 | 第69-70页 |
附录1 原子特征模板(部分) | 第70-71页 |
附录2 复合特征模板(部分) | 第71-72页 |
详细摘要 | 第72-76页 |