首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Web的主题搜索应用技术研究

中文摘要第1-3页
Abstract第3-7页
第1章 绪论第7-17页
   ·课题研究背景第7-11页
   ·当前隐含型Web信息获取研究概况第11-16页
     ·隐含型Web信息获取的起源和发展第11-13页
     ·国外隐含型Web信息获取技术的研究概况第13-14页
     ·国内隐含型Web信息获取技术的研究进展第14-16页
   ·本文主要研究内容与创新第16页
   ·文章的结构安排第16-17页
第2章 预备知识第17-33页
   ·Form分析相关理论基础第17-20页
     ·基于启发式原则的Form发现和过滤第17-18页
     ·LVS匹配理论第18-20页
   ·Form表单分析模型第20-26页
   ·Form处理过程第26-29页
   ·相关数据估算第29-32页
   ·本章小结第32-33页
第3章 中文数据源查询表单的过滤与领域识别第33-45页
   ·抽象表示与特征值提取第33-36页
     ·表单对象的抽象表示第33-34页
     ·特征值提取第34-36页
   ·基于中文Form的启发式过滤原则第36-37页
   ·Form相关领域自动识别算法第37-41页
   ·有效性验证与评价第41-44页
   ·本章小结第44-45页
第4章 面向隐含型Web页面爬虫系统体系结构设计第45-60页
   ·系统设计目标第45-46页
   ·Form处理模块结构设计第46-50页
     ·Form提取分析器第46-49页
     ·Form处理器第49页
     ·响应结果处理器第49-50页
   ·网络爬虫模块的结构分析与设计第50-56页
     ·相关类的结构分析第50-52页
     ·爬虫的程序结构设计第52-55页
     ·数据库结构设计第55-56页
   ·系统查询词更新部分的工作流程设计第56-58页
     ·相关算法(MQSA)设计第57页
     ·查询词可用性权值计算第57-58页
   ·面向领域本体知识的词汇库设计第58-59页
   ·本章小结第59-60页
第5章 系统性能测试与评估第60-67页
   ·系统运行环境第60-61页
   ·下载任务的实现第61-62页
   ·爬行目标的确定与系统初始化第62-63页
   ·爬行实验过程第63-66页
   ·本章小结第66-67页
结论第67-68页
参考文献第68-73页
附录第73-76页
致谢第76-77页
攻读学位期间发表的学术论文第77-78页

论文共78页,点击 下载论文
上一篇:营口市城乡少年儿童行为问题调查研究
下一篇:基于知识管理的企业产品创新支持体系研究