首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于中文分词检索技术的企业名称查重系统的研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-11页
   ·研究背景第7页
   ·中文分词发展概述及现状第7-8页
   ·本文的研究内容及论文结构第8-11页
第二章 中文分词概述第11-27页
   ·中文分词简介第11-13页
     ·中文分词的难点第11-13页
   ·中文分词算法的分类第13-18页
     ·基于字符串匹配的分词算法第13-16页
     ·基于理解的分词算法第16-17页
     ·基于统计的分词算法第17-18页
   ·中文分词算法的利弊对比第18-20页
   ·分词词典机制慨述第20-25页
     ·基于整词二分的分词词典机制第20-21页
     ·基于 Trie 索引树的分词词典机制第21-22页
     ·基于逐字二分的分词词典机制第22-23页
     ·双层 hash 的词典机制第23-25页
   ·分词性能评价指标第25-26页
     ·分词精度第25页
     ·分词速度第25-26页
     ·分词召回率第26页
     ·分词准确率第26页
   ·小结第26-27页
第三章 歧义消除技术与同音字和多音字处理第27-35页
   ·歧义的发现第27-30页
     ·双向扫描法第27页
     ·逐词扫描法第27-28页
     ·最长词次长词发现法第28-29页
     ·正向最大匹配+回退一字法第29-30页
   ·分词歧义消解算法介绍第30-31页
     ·规则型歧义消解算法第30页
     ·词概率法歧义消解算法第30-31页
     ·t-测试算法第31页
   ·歧义处理的困难第31-32页
   ·同音字和多音字处理方法构思第32-34页
     ·同音字处理第32页
     ·同音字处理实施简介第32-33页
     ·多音字处理第33页
     ·多音字处理实施简介第33-34页
   ·小结第34-35页
第四章 系统的设计与实现第35-49页
   ·系统设计的目的第35页
   ·系统总体设计第35-39页
     ·原工商企业名称数据库的概述第35-36页
     ·原工商企业名称查重应用情况第36页
     ·系统的解决方案第36-39页
   ·系统实现第39-45页
     ·开发平台及开发工具选择第39-40页
     ·系统实现第40-45页
   ·系统的测试第45-47页
     ·系统测试方案第45-46页
     ·测试流程第46-47页
     ·测试结果第47页
   ·小结第47-49页
第五章 结束语第49-51页
致谢第51-53页
参考文献第53-56页

论文共56页,点击 下载论文
上一篇:基于信息流的隐通道自动检测的研究与实现
下一篇:基于Lucene/HttpClient的垂直搜索引擎研究与实现