基于元搜索的知识获取方法与系统集成研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-16页 |
·研究背景与意义 | 第9-14页 |
·知识获取的重要性 | 第9-10页 |
·企业和组织的需求 | 第10-12页 |
·研究现状 | 第12-14页 |
·研究内容和方法 | 第14-15页 |
·文章组织结构 | 第15-16页 |
2 元搜索原理 | 第16-31页 |
·元搜索引擎概述 | 第16-19页 |
·元搜索引擎的特点 | 第16-17页 |
·元搜索引擎的原理 | 第17-19页 |
·查询扩展技术 | 第19-22页 |
·基于领域知识的查询扩展 | 第19-21页 |
·领域知识库的构建 | 第21-22页 |
·元搜索的关键技术和方法 | 第22-28页 |
·元搜索引擎的调度方法 | 第23-24页 |
·元搜索的结果消重策略 | 第24-27页 |
·元搜索结果合成 | 第27-28页 |
·元搜索的实现方法 | 第28-31页 |
·页面解析方法 | 第28-30页 |
·调用搜索引擎接口 | 第30-31页 |
3 搜索结果的聚类处理 | 第31-43页 |
·文本预处理 | 第31-36页 |
·文本表示模型 | 第32页 |
·向量空间模型 | 第32-33页 |
·特征提取 | 第33-36页 |
·基于元搜索结果的聚类算法 | 第36-43页 |
·奇异值分解 | 第36-37页 |
·潜在语义分析 | 第37-38页 |
·聚类算法流程 | 第38-41页 |
·聚类结果分析 | 第41-43页 |
4 基于元搜索结果的网页内容抽取 | 第43-55页 |
·网页信息抽取 | 第43-45页 |
·信息抽取概述 | 第43-44页 |
·信息抽取的局限性 | 第44-45页 |
·基于节点特征分析的网页内容抽取算法 | 第45-51页 |
·新闻类网页内容抽取方法概述 | 第45页 |
·抽取算法流程 | 第45-48页 |
·抽取算法实例 | 第48-50页 |
·抽取算法实验结果及参数检验 | 第50-51页 |
·抽取方法综合 | 第51-55页 |
·元搜索结果正文匹配判定方法 | 第51-53页 |
·基于节点特征分析方法与包装器方法结合 | 第53-55页 |
5 基于元搜索的互联网知识获取系统设计与实现 | 第55-69页 |
·系统的架构和功能模块 | 第55-56页 |
·系统的各子模块的实现 | 第56-68页 |
·元数据获取模块 | 第58-61页 |
·搜索结果处理模块 | 第61-62页 |
·聚类模块 | 第62-64页 |
·信息抽取模块 | 第64-65页 |
·最终结果处理模块 | 第65-68页 |
·系统运行效果以及分析 | 第68-69页 |
结论 | 第69-70页 |
参考文献 | 第70-74页 |
攻读硕士学位期间发表学术论文情况 | 第74页 |
攻读硕士学位期间参与研究项目情况 | 第74-75页 |
致谢 | 第75-76页 |