首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

相似字符串匹配过滤算法研究

摘要第1-6页
Abstract第6-10页
插图索引第10-11页
附表索引第11-12页
第1章 绪论第12-18页
   ·研究目的及意义第12-13页
   ·Q-gram 过滤算法研究现状第13-15页
     ·相似字符串匹配简介第13-14页
     ·Q-gram 索引第14-15页
     ·过滤算法研究现状第15页
   ·本文主要工作与结构第15-18页
第2章 中文索引与精确字符串匹配第18-30页
   ·索引结构简介第18-22页
     ·常用序列索引第18-19页
     ·Q-gram 索引第19-21页
     ·中文处理与q-gram 索引第21-22页
   ·中文Bigram 二级哈希索引结构第22-26页
     ·GB2312 编码第22页
     ·中文 Bigram 二级哈希索引第22-24页
     ·中文字符串精确匹配第24-26页
   ·中文Bigram 二级哈希索引实验分析第26-28页
     ·实验语料库简介第26-27页
     ·实验结果第27-28页
   ·小结第28-30页
第3章 索引优化第30-44页
   ·索引压缩第30-35页
     ·整数序列编码d-gaps第30-31页
     ·参数编码和无参数编码第31-32页
     ·位编码和字节编码第32-33页
     ·索引压缩处理过程第33-35页
   ·索引建立第35-37页
     ·索引建立与压缩第35-36页
     ·索引建立与内存管理第36-37页
   ·索引更新方案第37-38页
   ·索引压缩实验分析第38-43页
     ·各序列整数值与出现次数统计实验第38-39页
     ·各压缩编码性能对比实验第39-42页
     ·索引压缩效果第42-43页
   ·小结第43-44页
第4章 相似字符串匹配过滤算法及改进第44-60页
   ·相似字符串过滤算法第44-47页
     ·过滤算法简介第44-45页
     ·过滤准则第45页
     ·相似字符串过滤算法匹配过程第45-47页
   ·匹配区域特征提取第47-50页
   ·基于匹配区域特征的改进过滤算法AdBlock第50-53页
     ·文本预处理、输入查询和查询预处理第51页
     ·过滤区确定第51-52页
     ·过滤、验证和输出第52-53页
   ·AdBlock 算法伪代码第53-54页
   ·AdBlock 算法退化第54页
   ·实验结果及分析第54-58页
     ·实验环境第54页
     ·算法性能分析第54-58页
   ·结论第58-60页
结论第60-62页
参考文献第62-68页
附录 A 攻读硕士学位期间发表的论文目录第68-70页
附录 B 攻读硕士学位期间参加的项目第70-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:基于领域本体的网络产品检索引擎的研究与实现
下一篇:基于PPT文档的信息隐藏技术研究