提要 | 第1-8页 |
第1章 绪论 | 第8-22页 |
·研究背景 | 第8-11页 |
·Web信息检索的研究意义 | 第8-9页 |
·Web信息检索的发展 | 第9页 |
·Web信息检索的现状与未来 | 第9-11页 |
·搜索引擎 | 第11-14页 |
·搜索引擎的分类 | 第11-12页 |
·搜索引擎的发展历史 | 第12-13页 |
·搜索引擎的工作原理 | 第13-14页 |
·搜索引擎的局限性 | 第14页 |
·主题爬行技术综述 | 第14-17页 |
·主题爬行的概念 | 第15页 |
·主题爬行系统的基本原理 | 第15-17页 |
·本体论及其研究现状 | 第17-20页 |
·本体论的概念 | 第17-18页 |
·本体的建模元语 | 第18-19页 |
·常用的本体库简介 | 第19页 |
·本体在信息检索中的应用 | 第19-20页 |
·本文的工作 | 第20-22页 |
第2章 相关技术 | 第22-38页 |
·主题爬行算法 | 第22-23页 |
·FishSearch算法 | 第22页 |
·SharkSearch算法 | 第22页 |
·智能爬行 | 第22-23页 |
·加速聚焦爬虫 | 第23页 |
·文本分类与聚类技术 | 第23-36页 |
·文本预处理 | 第23-24页 |
·文本表示 | 第24-25页 |
·特征提取 | 第25-27页 |
·分类算法 | 第27-29页 |
·聚类算法 | 第29-34页 |
·性能评估 | 第34-36页 |
·小结 | 第36-38页 |
第3章 基于本体的主题爬行框架 | 第38-48页 |
·爬行框架 | 第38-40页 |
·本体、元数据和词汇层 | 第40-41页 |
·相关性计算 | 第41-42页 |
·文本检索 | 第42-43页 |
·分类和过滤文本 | 第43页 |
·实验 | 第43-46页 |
·实验设定 | 第43页 |
·实验结果 | 第43-46页 |
·小结 | 第46-48页 |
第4章 PU文本分类方法的研究 | 第48-68页 |
·PU文本分类 | 第48-51页 |
·Self-Training的两步框架 | 第49页 |
·可信反例的提取 | 第49-50页 |
·One-Class SVM算法 | 第50-51页 |
·构造分类器 | 第51页 |
·基于本体特征提取的PU分类方法 | 第51-54页 |
·基于本体的文本特征提取方法 | 第51-52页 |
·基于本体特征提取的SVM算法 | 第52-53页 |
·基于本体特征提取的PEBL算法 | 第53-54页 |
·基于Co-Training与AP结合的PU分类方法 | 第54-60页 |
·Co-Training方法介绍 | 第54-55页 |
·Co-Training的PAC定义 | 第55-56页 |
·Co-Training在PU分类中的应用 | 第56-57页 |
·Affinity Propagation方法 | 第57-59页 |
·AP方法在PU分类中的应用 | 第59-60页 |
·实验 | 第60-66页 |
·数据集 | 第60页 |
·实验1 | 第60-62页 |
·实验2 | 第62-64页 |
·实验3 | 第64-66页 |
·小结 | 第66-68页 |
第5章 基于本体的网页隧道穿越方法 | 第68-84页 |
·隧道穿越相关策略 | 第68-70页 |
·基于Context Graph的穿越策略 | 第68-69页 |
·基于增强学习的爬行策略 | 第69-70页 |
·基于本体的灰色隧道穿越技术 | 第70-77页 |
·隧道的定义 | 第70页 |
·网页分块 | 第70-72页 |
·网页内容块的识别与合并 | 第72-74页 |
·穿越隧道算法 | 第74-75页 |
·实验结果 | 第75-77页 |
·基于关联规则的黑色隧道穿越技术 | 第77-82页 |
·黑色隧道的定义及处理 | 第77页 |
·基于关联规则的隧道穿越 | 第77-80页 |
·实验结果 | 第80-82页 |
·小结 | 第82-84页 |
第6章 基于本体的面向用户主题爬行 | 第84-96页 |
·系统流程图 | 第85页 |
·面向用户的主题爬行 | 第85-90页 |
·用户兴趣的获取与优化 | 第86页 |
·用户兴趣的建模 | 第86-89页 |
·用户兴趣的更新 | 第89-90页 |
·用户组建立 | 第90页 |
·系统的实现 | 第90-94页 |
·技术方案 | 第90-91页 |
·技术架构 | 第91-92页 |
·系统的实现界面 | 第92-93页 |
·系统性能评估 | 第93-94页 |
·小结 | 第94-96页 |
第7章 结论与展望 | 第96-100页 |
·本文的创新工作 | 第96-97页 |
·不足之处及未来的工作 | 第97-100页 |
参考文献 | 第100-107页 |
攻读博士期间发表的学术论文及其它成果 | 第107-108页 |
致谢 | 第108-109页 |
摘要 | 第109-111页 |
Abstract | 第111-113页 |