首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

字符串理论研究与应用探讨

提要第1-7页
第一章 绪论第7-11页
   ·搜索引擎行业发展现状第7-8页
   ·本文主要工作第8-11页
     ·网页信息提取第9页
     ·重复词语的检测第9-10页
     ·搜索引擎词典与新词过滤分析第10页
     ·结论与展望第10-11页
第二章 搜索引擎与分词技术第11-22页
   ·搜索引擎工作过程与原理第11-16页
     ·搜索引擎的工作过程第11-12页
     ·搜索引擎各部分的组成关系第12-15页
     ·搜索引擎的相关质量指标第15-16页
   ·搜索引擎与中文分词技术第16-21页
     ·中文分词在搜索引擎中应用的必要性第16-17页
     ·目前主要应用的中文分词方法第17-20页
     ·中文分词所面临的问题第20-21页
   ·小结第21-22页
第三章 网页信息提取第22-34页
   ·网页内容的获取第22-25页
     ·HTTPLOOK 的使用第22-23页
     ·获取网页内容的具体方法第23-25页
   ·网页内容的解析第25-33页
     ·HTML 简介第25-28页
     ·HTMLPARSER 的特点及应用第28-31页
     ·网页解析的具体过程第31-33页
   ·小结第33-34页
第四章 利用水平分割法求最大重复串第34-64页
   ·关于后缀数组第34-40页
     ·基本概念第34-35页
     ·后缀数组的构造方法第35-37页
     ·最长公共前缀第37-40页
   ·利用水平分割法求字符串的最大重复子串第40-63页
     ·定义第40-42页
     ·后缀结构及REPEATS 算法第42-43页
     ·利用水平分割法求MAXIMAL REPEATS第43-51页
     ·计算所有的MAXIMAL NE-REPEATS第51-60页
     ·计算所有的MAXIMAL SNE-REPEATS第60-63页
   ·小结第63-64页
第五章 分词字典的结构与新词的排查第64-70页
   ·分词词典的组织与实现第64-67页
     ·分词词典的物理结构第64-65页
     ·词典的逻辑组织第65-67页
   ·新词的排查第67-69页
     ·词典的检索第67-69页
     ·新词的过滤第69页
   ·小结第69-70页
第六章 结论与展望第70-73页
   ·目标实现及不足之处第70-71页
     ·已完成工作的效率和质量分析第70-71页
     ·本方案的不足之处第71页
   ·未来工作的展望和下一步工作设想第71-73页
     ·现有工作的完善第71-72页
     ·基于INTERNET 的多语言新词语检测第72-73页
参考文献第73-77页
摘要第77-80页
ABSTRACT第80-83页
致谢第83页

论文共83页,点击 下载论文
上一篇:基于MVC架构的E-Learning网络课程管理系统
下一篇:单目视觉测头成像三维测量技术及特征点角度偏置误差补偿研究