首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

锚文本增量主题爬行

内容提要第1-7页
第一章 绪论第7-13页
   ·研究背景:Web的兴起第7-10页
   ·本文工作第10-12页
   ·本文的组织第12-13页
第二章 相关技术第13-30页
   ·主题爬行技术第13-15页
   ·爬行策略第15-18页
     ·基于内容的爬行策略第15-17页
     ·基于网络拓扑的爬行策略第17-18页
   ·文本分类技术第18-29页
     ·文本处理与表示第18-23页
     ·文本分类模型第23-28页
     ·分类效果评价第28-29页
   ·小结第29-30页
第三章 锚文本增量主题爬行器第30-43页
   ·系统框架及算法流程第30-31页
   ·离线训练第31-36页
     ·训练集选择第32-33页
     ·后端分类器的训练第33页
     ·前端分类器的训练第33-36页
   ·在线爬行第36-42页
     ·爬行队列及其初始化第36-37页
     ·网页抓取第37-39页
     ·网页解析第39-41页
     ·URL预测第41-42页
   ·增量特性第42-43页
第四章 实验与分析第43-50页
   ·系统实现第43-44页
   ·实验结论第44-50页
第五章 结论与展望第50-53页
参考文献第53-55页
摘要第55-60页
Abstract第60-65页
致谢第65-66页
导师及作者简介第66页

论文共66页,点击 下载论文
上一篇:中国松嫩草原短芒野大麦(Hordeum brevisubulatum (Trin.)Link)人工种群的分子遗传与表观遗传多样性及其种群遗传结构的研究
下一篇:人参叶和根cDNA文库构建及表达序列标签分析