基于Web的主题搜索应用技术研究

中文摘要	第1-3页
Abstract	第3-7页
第1章绪论	第7-17页
·课题研究背景	第7-11页
·当前隐含型Web信息获取研究概况	第11-16页
·隐含型Web信息获取的起源和发展	第11-13页
·国外隐含型Web信息获取技术的研究概况	第13-14页
·国内隐含型Web信息获取技术的研究进展	第14-16页
·本文主要研究内容与创新	第16页
·文章的结构安排	第16-17页
第2章预备知识	第17-33页
·Form分析相关理论基础	第17-20页
·基于启发式原则的Form发现和过滤	第17-18页
·LVS匹配理论	第18-20页
·Form表单分析模型	第20-26页
·Form处理过程	第26-29页
·相关数据估算	第29-32页
·本章小结	第32-33页
第3章中文数据源查询表单的过滤与领域识别	第33-45页
·抽象表示与特征值提取	第33-36页
·表单对象的抽象表示	第33-34页
·特征值提取	第34-36页
·基于中文Form的启发式过滤原则	第36-37页
·Form相关领域自动识别算法	第37-41页
·有效性验证与评价	第41-44页
·本章小结	第44-45页
第4章面向隐含型Web页面爬虫系统体系结构设计	第45-60页
·系统设计目标	第45-46页
·Form处理模块结构设计	第46-50页
·Form提取分析器	第46-49页
·Form处理器	第49页
·响应结果处理器	第49-50页
·网络爬虫模块的结构分析与设计	第50-56页
·相关类的结构分析	第50-52页
·爬虫的程序结构设计	第52-55页
·数据库结构设计	第55-56页
·系统查询词更新部分的工作流程设计	第56-58页
·相关算法(MQSA)设计	第57页
·查询词可用性权值计算	第57-58页
·面向领域本体知识的词汇库设计	第58-59页
·本章小结	第59-60页
第5章系统性能测试与评估	第60-67页
·系统运行环境	第60-61页
·下载任务的实现	第61-62页
·爬行目标的确定与系统初始化	第62-63页
·爬行实验过程	第63-66页
·本章小结	第66-67页
结论	第67-68页
参考文献	第68-73页
附录	第73-76页
致谢	第76-77页
攻读学位期间发表的学术论文	第77-78页