首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于博文分布特征的博客精选技术研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-14页
   ·研究背景第9-12页
     ·互联网的发展与Blog的兴起第9-10页
     ·基于Blog的搜索研究第10-11页
     ·TREC测试的博客精选任务第11-12页
   ·本文的工作内容第12-13页
   ·本文的组织第13-14页
第二章 博客精选任务的研究现状第14-19页
   ·前言第14页
   ·Blog精选任务中的主题选取第14-15页
   ·检索系统的评估体系第15-16页
   ·Blog精选任务的解决方案第16-19页
     ·信息检索策略第16-17页
     ·TREC2008中的两个最佳博客精选方案第17-19页
第三章 博客数据的前期处理第19-28页
   ·查询话题第19-20页
   ·博客圈的结构第20页
   ·数据集的构建第20-23页
     ·博客选择第21页
     ·博客抓取第21-22页
     ·组织数据第22-23页
   ·检索结果的精确性评价标准第23-24页
   ·实验辅助工具包第24-27页
   ·预处理第27-28页
第四章 基于博文相关性分布的精选设计第28-42页
   ·基线实验(Baseline)的设计第28-33页
     ·基线实验A(Baseline A)第28-29页
     ·基线实验B(Baseline B)第29-31页
     ·基线实验C(Baseline C)第31-33页
   ·博客的相似分布特征第33-37页
     ·坐标转换与归一化第34-35页
     ·区间划分第35-37页
   ·基于SVM分类器与博客相似分布的博客精选技术第37-42页
     ·基于超平面距离的SVM分类器第37-40页
     ·基于SVM的博客精选第40-42页
第五章 查询扩展与类别分布不平衡性的解决第42-53页
   ·查询扩展第42-45页
     ·经典Rocchio算法第42-43页
     ·基于TFIDF的Rocchio算法第43-44页
     ·基于TFIDF的Rocchio算法与相关反馈的实现第44-45页
   ·类别不平衡性第45-51页
     ·传统类分布预测方法第46-47页
     ·改进的Classify & Count算法第47-50页
     ·特征-质心向量和样本聚类第50-51页
   ·实验结果第51-53页
第六章 总结与展望第53-55页
   ·本文工作总结第53页
   ·工作展望第53-55页
参考文献第55-58页
附录第58-60页
致谢第60-61页
攻读硕士学位期间发表的论文第61页

论文共61页,点击 下载论文
上一篇:基于Web的NETCONF网络管理系统的设计与实现
下一篇:基于Web分类技术的农业信息获取系统的研究与实现