首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文自动分词技术的改进与优化研究

摘要第1-6页
Abstract第6-13页
第1章 绪论第13-21页
   ·研究背景和意义第13-14页
   ·国内外研究现状第14-15页
   ·相关理论和技术第15-18页
     ·中文自动分词技术第15-16页
     ·命名实体识别第16-17页
     ·搜索引擎技术第17-18页
   ·研究内容和创新点第18-19页
     ·主要研究内容第18页
     ·论文创新点第18-19页
   ·论文整体结构第19-21页
第2章 中文自动分词方法研究第21-29页
   ·中文自动分词及其评价标准第21-22页
     ·中文自动分词第21页
     ·中文自动分词评价标准第21-22页
   ·中文自动分词方法介绍第22-27页
     ·基于分词词典的方法第22-24页
     ·基于概率统计的方法第24-26页
     ·基于知识推理的方法第26-27页
   ·中文自动分词方法的比较与分析第27页
   ·本章小结第27-29页
第3章 中文自动分词词典研究第29-38页
   ·自动分词词典的特点第29-30页
   ·常见中文自动分词词典机制的介绍第30-35页
     ·基于整词二分的自动分词词典机制第30-31页
     ·基于 Trie 索引树的自动分词词典机制第31-33页
     ·基于逐字二分的自动分词词典机制第33-34页
     ·基于 PATRICIA 树的自动分词词典机制第34-35页
   ·基于多哈希平衡二叉查找树的分词词典机制第35-36页
   ·本章小结第36-38页
第4章 中文自动分词难点研究第38-47页
   ·中文自动分词的分词规范第38-39页
     ·制定分词规范的目的和意义第38页
     ·典型的分词规范的介绍第38-39页
   ·中文自动分词的切分歧义处理第39-40页
   ·中文自动分词的命名实体识别第40-45页
     ·一种简单的分阶段的中文人名识别方法第41-44页
     ·中文地名和机构名的识别第44-45页
   ·本章小结第45-47页
第5章 基于 CRF 和规则的中文医疗机构名称识别第47-57页
   ·中文医疗机构名称分析第47-50页
     ·内部语义结构分析第47-49页
     ·外部上下文特征分析第49-50页
   ·中文医疗机构名称识别第50-53页
     ·基于条件随机场的中文医疗机构名识别第50-51页
     ·CRF 模型中的特征模板的选择第51-52页
     ·训练语料的处理第52页
     ·CRF 模型训练过程第52-53页
     ·验证规则第53页
   ·中文医疗机构名称识别的实验结果与分析第53-54页
     ·实验环境和结果第53-54页
     ·错误分析第54页
   ·本章小结第54-57页
第6章 中文自动分词技术在中文搜索引擎中的应用第57-63页
   ·搜索引擎简介第57-58页
   ·自动分词和搜索引擎的关系第58-60页
   ·自动分词在搜索引擎中的具体应用第60-61页
     ·自动分词技术在搜索引擎网页搜索阶段的应用第60页
     ·自动分词技术在搜索引擎预处理阶段的应用第60-61页
     ·自动分词技术在搜索引擎查询处理阶段的应用第61页
     ·自动分词技术在搜索引擎用户分析阶段的应用第61页
   ·本章小结第61-63页
总结与展望第63-65页
 本文总结第63页
 对未来工作的展望第63-65页
参考文献第65-68页
攻读硕士学位期间发表的论文第68-69页
致谢第69-70页
附录1 原子特征模板(部分)第70-71页
附录2 复合特征模板(部分)第71-72页
详细摘要第72-76页

论文共76页,点击 下载论文
上一篇:基于本体和规则的计算机故障诊断研究
下一篇:基于FPGA的盲音频水印研究