首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于数字有机体数据库的搜索引擎的理论研究与实现

摘要第1-5页
Abstract第5-10页
第一章 引言第10-16页
   ·研究背景第10-11页
   ·国内外研究现状第11-13页
     ·DBXplore第11-12页
     ·DISCOVER第12-13页
     ·BANKS第13页
   ·本文所做工作第13-14页
   ·论文组织第14-16页
第二章 基于数字有机体数据库的搜索引擎概述第16-22页
   ·基于数字有机体的搜索引擎的基本架构第16-19页
     ·功能需求第16-17页
     ·模块组织第17-19页
   ·数字有机体数据库第19-22页
     ·数字有机体数据库的拓扑结构第20-21页
     ·数据库的定位和访问第21-22页
第三章 分词算法的研究与实现第22-36页
   ·英文分词算法研究与实现第23-26页
     ·英文文本扫描和单词获取第23-25页
     ·英文单词的原形识别第25-26页
   ·中文分词算法概述第26-29页
     ·最大匹配算法第26-28页
     ·最大概率算法第28-29页
   ·基于前缀树和动态规划的新型中文分词算法第29-36页
     ·中文构词特点第29-30页
     ·中文命名识别第30-31页
     ·前缀树结构在汉语分词中的使用第31-32页
     ·基于动态规划和前缀树的汉语分词算法第32-36页
第四章 文本分类算法的研究和实现第36-55页
   ·文本特征选择方法第37-39页
     ·TF-IDF 度量方法第37-38页
     ·χ~2 统计量方法第38页
     ·互信息度量第38-39页
   ·常见文本分类算法介绍第39-42页
     ·单纯贝叶斯分类算法第39-40页
     ·K 均值聚类算法第40-42页
   ·基于支持向量机的文本分类器第42-47页
     ·支持向量机文本分类器的算法框架第43页
     ·支持向量机文本分离器面临的问题和解决策略第43-44页
     ·单纯Rocchio 算法第44-45页
     ·基于Rocchio 的文本聚类算法第45-46页
     ·基于文本聚类的支持向量机文本分类器第46-47页
   ·支持向量机分类器的数值解法第47-53页
     ·原始问题转换为对偶问题第47-48页
     ·约束问题转换为无约束问题第48-49页
     ·共轭梯度算法第49-50页
     ·核心数据结构第50-53页
   ·搜索请求分类第53-55页
第五章 搜索引擎的实现第55-73页
   ·索引内容与存放方式第55-59页
     ·索引组成与内容第56-58页
     ·索引的分布式存放第58-59页
   ·分布式线程池及其行为逻辑第59-64页
     ·分布式线程池简介第60-61页
     ·分布式线程池的启动逻辑第61-62页
     ·分布式线程池的运转逻辑第62-63页
     ·分布式线程池的退出逻辑第63-64页
   ·分布式线程池的设计模式和类体系结构第64-69页
     ·分布式线程池的类体系结构第64-67页
     ·分布式线程池的设计模式第67-69页
   ·搜索任务的调度和执行流程第69-73页
     ·搜索任务的调度第69-70页
     ·搜索任务的执行第70-73页
第六章 系统测试与分析第73-80页
   ·测试环境第73页
   ·测试标准第73-74页
   ·汉语言分词算法测试第74-76页
   ·文本分类算法测试第76-77页
   ·搜索引擎整体性能测试第77-80页
第七章 结论第80-81页
致谢第81-82页
参考文献第82-85页
攻硕期间取得的研究成果第85-86页

论文共86页,点击 下载论文
上一篇:视频运动目标检测与跟踪算法研究
下一篇:学校工会管理系统设计与实现