首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

垂直搜索技术在社交网站中的应用与研究

摘要第1-6页
ABSTRACT第6-8页
目录第8-10页
第一章 绪论第10-14页
   ·研究背景第10页
   ·社交网站第10-11页
   ·垂直搜索技术第11-12页
     ·垂直搜索第11-12页
     ·垂直搜索技术的发展现状第12页
   ·研究内容及论文结构第12-14页
第二章 相关技术研究第14-29页
   ·聚焦爬虫技术第14-23页
     ·聚焦爬虫工作流程第14页
     ·聚焦爬虫搜索策略第14-16页
     ·主题网页链接分析第16-20页
     ·网页主题判定模型第20-22页
     ·向量空间模型中的特征提取第22-23页
   ·搜索结果聚类第23-25页
   ·半结构化信息抽取第25-28页
     ·半结构化文本第25-26页
     ·现有网页信息抽取技术第26-28页
   ·本章小结第28-29页
第三章 垂直搜索算法优化第29-39页
   ·链接分析的改进-ZHITS第29-33页
     ·HITS算法的过程第29-31页
     ·针对社交网站网页的分析算法-ZHITS第31-33页
   ·特征提取方法的改进第33-35页
     ·传统提取方法第33-34页
     ·针对社交网站网页的特征提取方法第34-35页
   ·聚类算法改进第35-38页
     ·K-means算法分析第35-37页
     ·改进的K-means算法第37-38页
   ·本章小结第38-39页
第四章 系统模块设计与实现第39-51页
   ·基于Heritrix的聚焦爬虫设计第39-44页
     ·Heritrix第39-40页
     ·主题模块的扩展第40-41页
     ·爬虫系统设计第41-42页
     ·聚焦爬虫的性能标准第42-43页
     ·爬虫性能实验第43-44页
   ·结果聚类模块实现第44-47页
     ·改进的K-means算法实现第44-45页
     ·聚类结果评价标准第45-46页
     ·实验分析第46-47页
   ·信息抽取模块设计第47-50页
     ·支持AJAX的单页多记录信息抽取第47-48页
     ·实验分析第48-50页
   ·本章小结第50-51页
第五章 社交网站后台设计及搜索集成第51-59页
   ·铺路石微博功能需求分析第51页
   ·建站使用技术第51-53页
   ·后台框架设计及搜索推送集成第53-54页
   ·集成效果测验第54-59页
第六章 总结与展望第59-60页
参考文献第60-62页
致谢第62-63页
攻读学位期间发表的学术论文目录第63页

论文共63页,点击 下载论文
上一篇:网络热点话题的传播模型分析
下一篇:基于多点触控的围棋对弈软件在Android上的研究与实现