基于本体的面向股票领域搜索引擎的实现技术研究
中文摘要 | 第1-3页 |
ABSTRACT | 第3-6页 |
第一章 绪论 | 第6-11页 |
·课题研究背景、目的和意义 | 第6-8页 |
·相关领域的研究现状 | 第8-9页 |
·本文的主要研究工作和创新之处 | 第9页 |
·论文结构 | 第9-11页 |
第二章 基于 Lucene 的搜索引擎原理 | 第11-19页 |
·搜索引擎概述 | 第11页 |
·搜索引擎的基本结构 | 第11-12页 |
·搜索引擎的工作机制 | 第12-14页 |
·搜索引擎的数据采集机制 | 第12-13页 |
·搜索引擎的数据组织机制 | 第13页 |
·搜索引擎的用户检索机制 | 第13-14页 |
·基于 Lucene的搜索引擎框架 | 第14-17页 |
·Lucene 简介 | 第14页 |
·Lucene 索引文件格式简述 | 第14-15页 |
·Lucene 搜索机制 | 第15-16页 |
·Lucene 的分析器 | 第16-17页 |
·本文研究重点 | 第17-19页 |
第三章 面向领域的爬行技术研究 | 第19-30页 |
·Web 抓取原理 | 第19-21页 |
·爬行策略概述 | 第19-20页 |
·网页特点及其处理关键 | 第20页 |
·爬行器比较 | 第20-21页 |
·聚焦爬行器工作原理及关键技术概述 | 第21-22页 |
·聚焦爬行器系统体系结构 | 第22-23页 |
·面向股票领域搜索引擎爬行器的设计与实现 | 第23-29页 |
·HITS 算法简介 | 第23-24页 |
·针对主题相关网页集合的算法改进 | 第24页 |
·爬行器基本实现 | 第24-25页 |
·提高爬行器效率 | 第25-27页 |
·主要模块设计及评价 | 第27-29页 |
·本章小结 | 第29-30页 |
第四章 基于统计的网页分析方法研究 | 第30-40页 |
·互联网上的语料分类 | 第30-31页 |
·HTML 文档的特点 | 第30-31页 |
·XML 文档的特点 | 第31页 |
·网页数据分析概述及研究现状 | 第31-32页 |
·网页分析方法的改进 | 第32-37页 |
·网页内容解析 | 第33页 |
·传统网页数据抽取方法介绍 | 第33-35页 |
·基于统计的中文股票类网页正文信息抽取方法 | 第35-37页 |
·对改进方法的效果分析 | 第37-38页 |
·本章小结 | 第38-40页 |
第五章 本体技术与搜索引擎技术融合的探索 | 第40-49页 |
·本体概念与相关技术 | 第40-42页 |
·本体的概念 | 第40页 |
·本体的分类 | 第40-41页 |
·描述领域知识本体的框架模型 | 第41页 |
·本体的描述语言 | 第41-42页 |
·本文系统中EO 本体的构建和描述 | 第42-45页 |
·对EO 本体结构的定义 | 第42页 |
·EO 本体库模型的实现 | 第42-45页 |
·基于EO 的股票搜索平台试验系统 | 第45-47页 |
·实验系统简介 | 第45页 |
·系统主要模块设计 | 第45-47页 |
·原型系统验证及评价 | 第47页 |
·本章小结 | 第47-49页 |
第六章 总结与展望 | 第49-50页 |
参考文献 | 第50-53页 |
论文发表和参加科研情况 | 第53-54页 |
致谢 | 第54页 |