首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式知识搜索系统的研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·课题的研究背景和意义第9-10页
   ·国内外相关研究工作第10-12页
     ·国外研究现状第10-11页
     ·国内研究现状第11-12页
   ·论文主要研究内容第12-13页
     ·知识源文本的获取第12页
     ·知识的提取与储存第12-13页
     ·系统配置的灵活性第13页
   ·论文的组织结构第13-14页
第二章 关键技术介绍第14-29页
   ·网络爬虫第14-18页
     ·万维网的出现与特点第14-15页
     ·网络爬虫的组成与工作流程第15-18页
   ·知识抽取第18-22页
     ·基于统计学方法的抽取第18-20页
     ·基于模式的抽取第20-21页
     ·基于本体思想的抽取第21-22页
   ·分布式存储与计算第22-29页
     ·分布式文件系统HDFS第22-24页
     ·分布式计算框架MapReduce第24-29页
第三章 分布式知识搜索系统的分析和设计第29-44页
   ·系统需求分析第29-30页
     ·功能性需求第29页
     ·非功能性需求第29-30页
   ·系统整体设计第30页
   ·工作流框架模块设计第30-31页
   ·分布式网络爬虫模块设计第31-34页
     ·注入模块第32页
     ·网页抓取模块第32-33页
     ·网页分析模块第33页
     ·URL过滤模块第33-34页
   ·分布式知识抽取模块设计第34-40页
     ·文本预处理模块第35页
     ·中文分词模块第35页
     ·词性标注模块第35-36页
     ·句法分析模块第36-37页
     ·语义分析模块第37-38页
     ·本体映射模块第38-40页
   ·知识库设计第40-44页
     ·类(Class)与类层次设计第40-42页
     ·属性(Property)设计第42-43页
     ·限制(Restriction)设计第43-44页
第四章 分布式知识搜索系统的实现第44-59页
   ·工作流框架实现第44-46页
   ·分布式网络爬虫实现第46-50页
     ·注入模块的实现第46-47页
     ·网页抓取模块的实现第47-48页
     ·网页分析模块的实现第48-49页
     ·URL过滤模块的实现第49-50页
   ·分布式知识抽取模块的实现第50-56页
     ·文本预处理模块的实现第50页
     ·中文分词与词性标注模块的实现第50-51页
     ·句法分析模块的实现第51-52页
     ·语义分析模块的实现第52-55页
     ·本体映射模块实现第55-56页
   ·知识库的实现第56-59页
     ·类的构造第56-57页
     ·属性的构造第57页
     ·实例的构造第57-59页
第五章 实验与分析第59-63页
   ·实验环境第59页
   ·实验结果和分析第59-63页
     ·分布式网络爬虫模块的效率第59-62页
     ·分布式知识抽取模块的效率第62页
     ·系统整体效率第62-63页
第六章 总结与展望第63-65页
   ·总结第63页
   ·下一步展望第63-65页
参考文献第65-71页
致谢第71-73页
作者攻读学位期间发表的学术论文目录第73页

论文共73页,点击 下载论文
上一篇:基于PCA和LDA的文本分类系统设计与实现
下一篇:CSC(汉信码)译码的实现与应用