首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基础教育资源搜索引擎中的中文分词技术研究

摘要第1-6页
ABSTRACT第6-7页
前言第7-9页
 1、研究背景第7-8页
 2、主要研究的内容第8页
 3、研究的成果第8页
 4、创新之点第8页
 5、本文的组织结构第8-9页
第一章 中文分词概述第9-15页
   ·中文分词技术的发展第9-10页
   ·中文分词技术的分类第10-11页
   ·分词技术的关键点第11-12页
   ·中文分词的困难第12-13页
   ·中文分词与搜索引擎第13-15页
第二章 高频特征词与歧义词处理第15-22页
   ·歧义的分类及现有的处理的方法第15-16页
   ·以特征词为标记的交集歧义切分第16-22页
     ·高频特征词的概念第17页
     ·交集歧义类型分析第17-18页
     ·含高频特征词的歧义词串处理策略第18-21页
     ·实验数据第21-22页
第三章 中文分词技术与未登录词处理第22-36页
   ·现有未登录词处理技术第22-23页
   ·中文姓名识别处理策略第23-31页
     ·关于姓名的统计第25-26页
     ·关于用名的统计第26-27页
     ·关于姓名后常用词的统计第27-28页
     ·中文姓名识别过程中遇到的几种类型第28页
     ·中文姓名识别处理办法第28-31页
   ·高频未登录词的识别处理策略第31-36页
     ·研究现状第31页
     ·数据结构定义第31-32页
     ·用来存贮高频词的Hash表第32页
     ·算法思想流程描述第32-34页
     ·高频词的处理第34-35页
     ·高频未登录词实验第35-36页
第四章 中文分词系统的设计与实现第36-46页
   ·系统框架设计第36-41页
     ·功能描述:第36页
     ·机械匹配分词算法:第36-38页
     ·分词系统结构图:第38页
     ·类模块介绍及类图设计第38-41页
   ·模块流程图第41-42页
     ·歧义识别模块流程图第41页
     ·未登录词程序模块流程图第41-42页
   ·分词接口设计第42-46页
     ·接口设计主要考虑因素:第42页
     ·用户调用分词动态库方法:第42-43页
     ·分词构造函数重载说明:第43-44页
     ·分词测试界面第44页
     ·分词系统的评价第44-46页
结语第46-48页
 1、本文总结第46-47页
 2、下一步的任务第47-48页
参考文献第48-50页
致谢第50-51页
附录第51-54页

论文共54页,点击 下载论文
上一篇:二次发射技术在炮射导弹应用中的理论研究
下一篇:水稻蛋白质含量分析与四种蛋白组分的QTL定位