摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-15页 |
·研究背景 | 第9-13页 |
·互联网的发展与Blog的兴起 | 第9-10页 |
·基于Blog的搜索研究 | 第10-12页 |
·TREC博客评测任务 | 第12-13页 |
·本文的工作内容 | 第13-14页 |
·本文的组织 | 第14-15页 |
第二章 主题相关博客属性挖掘技术的研究现状 | 第15-21页 |
·前言 | 第15页 |
·Blog精选任务中的主题选取 | 第15-18页 |
·检索系统的评估体系 | 第18-19页 |
·精选博文属性挖掘的解决方案 | 第19-21页 |
·博客检索技术概况 | 第19-20页 |
·TREC2009中的三个最佳主题相关博客属性挖掘方案 | 第20-21页 |
第三章 博客数据的前期预处理 | 第21-37页 |
·查询话题 | 第21-22页 |
·博客圈的结构 | 第22-23页 |
·数据集的构建 | 第23-26页 |
·博客选择 | 第24-25页 |
·博客抓取 | 第25页 |
·组织数据 | 第25-26页 |
·检索结果的精确性评价标准 | 第26-27页 |
·实验辅助工具包 | 第27-32页 |
·斯坦福命名实体工具 | 第28-29页 |
·Indri | 第29-32页 |
·预处理 | 第32页 |
·查询扩展 | 第32-37页 |
·局部查询扩展技术 | 第33-34页 |
·全局查询扩展技术 | 第34-35页 |
·本文模型所采用的查询扩展方法 | 第35-37页 |
第四章 主题相关博客的精选设计 | 第37-45页 |
·前言 | 第37-38页 |
·博客精选实验设计 | 第38-44页 |
·精选实验A | 第38-39页 |
·精选实验B | 第39-41页 |
·精选实验C | 第41-44页 |
·主题相关博客精选设计 | 第44-45页 |
第五章 基于主题相关博客的属性挖掘模型设计 | 第45-52页 |
·前言 | 第45-46页 |
·博客属性挖掘模型 | 第46-52页 |
·情感与事实属性判断模型 | 第46页 |
·官方与私人属性判断模型 | 第46-50页 |
·博客深浅属性判断模型 | 第50-52页 |
第六章 总结与展望 | 第52-54页 |
·本文工作总结 | 第52-53页 |
·作展望 | 第53-54页 |
参考文献 | 第54-58页 |
致谢 | 第58-59页 |
攻读学位期间发表的学术论文目录 | 第59页 |