首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于标签与内容的blog检索实验系统研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-17页
   ·引言第9页
   ·研究背景第9-11页
     ·blog的自身特点第9-10页
     ·blog搜索与传统搜索引擎的区别第10-11页
   ·国内外blog搜索引擎成果及进展第11-15页
     ·国内blog搜索引擎基本状况第11-12页
     ·国外blog搜索引擎基本状况第12-13页
     ·国内外blog搜索相关理论的研究成果第13-15页
   ·本文的主要工作第15-16页
   ·论文的研究内容及结构第16-17页
第二章 搜索引擎系统介绍第17-27页
   ·搜索引擎的概念第17-18页
   ·搜索引擎的发展历程与未来方向第18-20页
   ·搜索引擎的分类介绍第20-21页
   ·搜索引擎的工作原理第21-25页
     ·信息搜集模块第22-23页
     ·索引器模块第23页
     ·检索器模块第23-25页
     ·用户检索接口模块第25页
   ·搜索引擎的评价标准第25-26页
   ·本章小结第26-27页
第三章 相关技术研究第27-42页
   ·Heritrix综述第27-32页
     ·Heritrix特点第27页
     ·Heritrix的体系结构第27-29页
     ·Heritrix的使用介绍第29-32页
   ·网页解析介绍第32-35页
     ·HTMLParser特点和基本功能第33页
     ·HTMLParser技术介绍第33-35页
   ·索引结构介绍第35-37页
     ·排索引结构第35-36页
     ·倒排索引结构第36-37页
   ·语义相似度计算第37-41页
     ·语义相似度概念第37-38页
     ·基于知网(Hownet)的语义相似度计算第38-41页
   ·本章小结第41-42页
第四章 博客标签的调查与推荐研究第42-52页
   ·标签的发展和研究现状第42-43页
   ·中文标签标注情况的具体分析第43-47页
     ·中文各个博客网站标签的"贴标率"分析第43-44页
     ·新浪网站博客的标签分析第44-47页
     ·新浪博客搜索标签分析第47页
     ·标签标注规范总结第47页
   ·基于分类和主题词提取的标签推荐系统第47-51页
     ·标签推荐系统架构图第48页
     ·标签推荐系统功能模块第48-49页
     ·标签推荐系统实现第49-50页
     ·实验结果与分析第50-51页
   ·本章小结第51-52页
第五章 blog搜索系统设计与实现第52-67页
   ·系统设计思想第52页
   ·系统的框架结构第52-54页
   ·网页获取模块介绍第54-57页
     ·抓取种子分析第55页
     ·开发所需的定制类第55-57页
     ·实现爬取第57页
   ·网页解析模块介绍第57-60页
     ·blog网页结构分析第58-59页
     ·HTMLParser具体实现第59-60页
   ·索引结构模块设计第60-63页
     ·建立索引流程第60-61页
     ·正排索引结构的建立第61-62页
     ·倒排索引结构的建立第62-63页
   ·检索算法模块设计第63-66页
     ·基于内容的检索第64-65页
     ·基于标签与内容的综合检索第65-66页
   ·本章小结第66-67页
第六章 实验与分析第67-72页
   ·系统的开发环境第67页
   ·实验数据集第67-68页
   ·系统搜索效果第68-69页
     ·查询界面第68-69页
     ·查询效果第69页
   ·结果分析第69-71页
   ·本章小结第71-72页
第七章 总结与展望第72-74页
   ·工作总结第72-73页
   ·下一步工作第73-74页
参考文献第74-79页
致谢第79-80页
作者攻读学位期间发表的学术论文目录第80页

论文共80页,点击 下载论文
上一篇:中文多文档摘要关键技术研究
下一篇:基于TPM的数据安全系统的设计与实现