首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于文本分析的互联网视频搜索引擎技术研究

摘要第1-6页
ABSTRACT第6-7页
目录第7-9页
第一章 绪论第9-16页
   ·研究背景第9-10页
   ·国内外研究现状第10-12页
   ·搜索引擎工作原理第12-14页
   ·本文的主要工作第14页
   ·本文内容的组织结构第14-16页
第二章 网络爬虫相关技术第16-30页
   ·网络爬虫的基本原理第16-18页
     ·网页采集模块第17页
     ·网页分析模块第17页
     ·信息处理模块第17-18页
   ·网页抓取策略第18-19页
     ·广度优先遍历策略第18页
     ·深度优先遍历策略第18-19页
     ·大站优先策略第19页
   ·网络爬虫中的多线程第19-21页
   ·网络爬虫的评价标准及爬取道德第21-22页
   ·网络爬虫的实现第22-29页
     ·解析URL第22-23页
     ·下载页面第23-24页
     ·页面分析第24-26页
     ·动态生成评论的获得第26-27页
     ·网络爬虫详细设计第27-29页
   ·小结第29-30页
第三章 基于文本信息的视频内容分析第30-40页
   ·中文分词第30-32页
     ·中文分词及其算法介绍第30-32页
     ·中文分词算法的实现第32页
   ·垃圾评论的过滤第32-37页
     ·VSM及词汇间语义相似度介绍第33-34页
     ·垃圾评论实现方法第34-37页
   ·基于相对词频的视频内容判断第37-39页
   ·小结第39-40页
第四章 基于用户日志的个性化搜索第40-49页
   ·WEB搜索日志挖掘第40-44页
     ·WEB搜索日志挖掘处理相关概念第40-42页
     ·Sogou用户搜索日志介绍第42-43页
     ·用户搜索日志数据预处理第43页
     ·用户搜索日志记录的分类第43-44页
   ·基于相似度比较的用户查询意图判断第44-48页
     ·句子间相似度计算第45-47页
     ·用户查询意图判断第47-48页
   ·小结第48-49页
第五章 实验及系统集成测试第49-57页
   ·网络爬虫测试第49-50页
   ·垃圾评论过滤测试第50-53页
   ·句子相似度匹配测试第53-54页
   ·系统集成测试第54-56页
   ·小结第56-57页
第六章 总结与展望第57-59页
   ·本文工作总结第57页
   ·下一步的工作第57-59页
致谢第59-60页
参考文献第60-63页
附录第63页

论文共63页,点击 下载论文
上一篇:基于模拟植物生长算法的设区市化肥配送中心空间选址优化研究
下一篇:融合深度信息的视觉注意模型研究及其应用