提要 | 第1-6页 |
第1章 绪论 | 第6-10页 |
·搜索引擎的发展 | 第6-8页 |
·问题的提出 | 第8-9页 |
·论文的主要研究内容和结构安排 | 第9-10页 |
第2章 主题爬行与文本分类技术 | 第10-23页 |
·主题爬行技术 | 第10-17页 |
·爬行策略 | 第13-17页 |
·文本分类技术 | 第17-23页 |
·文本的表示 | 第17-18页 |
·特征项的提取 | 第18-19页 |
·分类模型 | 第19-23页 |
第3章 通过链接分析查找两个实体的关联 | 第23-33页 |
·系统框架及算法流程 | 第23-24页 |
·离线训练 | 第24-26页 |
·在线爬行 | 第26-33页 |
·初始化 | 第26-27页 |
·爬行算法 | 第27-29页 |
·网页下载和解析 | 第29-32页 |
·爬行终止 | 第32-33页 |
第4章 实验与分析 | 第33-39页 |
·系统实现 | 第33页 |
·实验结果 | 第33-39页 |
第5章 总结与未来工作 | 第39-41页 |
·工作总结 | 第39页 |
·未来工作 | 第39-41页 |
参考文献 | 第41-43页 |
致谢 | 第43-44页 |
摘要 | 第44-47页 |
ABSTRACT | 第47-49页 |