首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

博客检索的关键技术研究

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-16页
   ·课题背景第8-10页
     ·博客的定义第8-9页
     ·博客的特点第9页
     ·博客的发展历程第9-10页
   ·博客检索的研究现状第10-11页
   ·相关工作第11-14页
     ·搜索引擎技术第11-13页
     ·文本分类技术第13-14页
   ·本文工作第14页
   ·本文结构第14-16页
第2章 博客检索系统架构设计第16-22页
   ·引言第16-17页
   ·系统总体架构设计第17-18页
   ·博客网页搜集第18-19页
   ·博客索引器第19-20页
   ·博客检索器第20-21页
   ·本章小结第21-22页
第3章 博客网页搜集第22-29页
   ·博客网站的选取第22页
   ·网络爬虫的调度策略第22-23页
   ·博客域名解析第23-25页
   ·非博客网页过滤第25-26页
   ·网页存储第26-27页
   ·博客网页的增量搜集第27页
   ·网页搜集系统测试第27-28页
   ·本章小结第28-29页
第4章 索引和检索第29-42页
   ·博客索引器设计第29-36页
     ·博客网页信息抽取第30-31页
     ·面向博客搜索的中文分词第31-32页
     ·博客文本分类第32-33页
     ·倒排索引第33-35页
     ·索引性能测试第35-36页
   ·博客检索器设计第36-41页
     ·搜索相关度排序第36-37页
     ·后台管理第37页
     ·用户接口第37-39页
     ·检索系统测试第39-41页
   ·本章小结第41-42页
第5章 基于标签和正文信息融合的博客文本分类第42-52页
   ·向量空间模型第42-43页
   ·支持向量机分类第43-44页
   ·博客文本特征提取第44-46页
     ·标签特征提取第44-45页
     ·正文特征提取第45-46页
   ·特征向量叠加算法第46页
   ·置信概率插值算法第46-48页
     ·构造置信概率插值分类器第46-47页
     ·训练过程第47页
     ·分类算法第47-48页
   ·实验与分析第48-51页
     ·数据集第48-49页
     ·评价方法第49页
     ·实验结果第49-51页
   ·本章小结第51-52页
结论第52-53页
参考文献第53-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:面向情感分析的特征抽取技术研究
下一篇:基于排序学习的翻译自动评价方法的研究