首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向问答类网站的垂直搜索引擎的研究与实现

摘要第1-6页
ABSTRACT第6-9页
目录第9-12页
第一章 绪论第12-16页
   ·课题研究背景及意义第12-13页
   ·国内外研究现状第13-14页
     ·研究宏观现状第13页
     ·研究技术现状第13-14页
   ·论文的主要研究内容第14-16页
第二章 垂直搜索引擎与问答类网站第16-29页
   ·搜索引擎性能评价标准第16页
   ·垂直搜索引擎概述第16-22页
     ·爬虫技术第17-19页
     ·信息抽取第19页
     ·索引技术第19页
     ·特征提取方法第19-20页
     ·空间向量模型和TFIDF函数第20-21页
     ·文本分类第21-22页
   ·问答类网站第22-26页
     ·概述第22页
     ·分类第22-24页
     ·特点第24-25页
     ·问答类搜索引擎第25-26页
   ·Nutch第26-29页
     ·Nutch的工作流程第26-27页
     ·Nutch索引组成第27页
     ·Nutch的排序机制第27-29页
第三章 问答类垂直搜索引擎的设计第29-48页
   ·问答类站点重要性的动态评价机制第29-32页
     ·Alexa第29-30页
     ·动态评价机制计算公式第30-31页
     ·权威站点动态评价的参数获取第31-32页
   ·问答搜索系统结构第32-34页
   ·问答爬虫第34-44页
     ·链接过滤器第35-36页
     ·主题过滤模块第36-37页
     ·初始种子模块第37-38页
     ·主题确立模块第38-39页
     ·主题相关度分析模块第39-44页
   ·问答信息抽取第44-45页
   ·问答索引第45-46页
   ·问答检索第46-47页
     ·问答检索系统第46页
     ·排序机制的改进第46-47页
   ·信息定制模块第47-48页
第四章 问答类垂直搜索引擎的实现第48-67页
   ·主题爬虫第48-58页
     ·主题词库的确立第48-50页
     ·主题相关度分析模块第50-58页
   ·问答信息索引及改进排序结果第58-64页
     ·实现流程第58-59页
     ·具体接口及数据表第59-64页
   ·中文分词部分第64-66页
   ·信息定制模块第66-67页
第五章 系统的运行及测试第67-73页
   ·实验条件第67页
   ·数据集的准备第67页
   ·系统的运行步骤第67-68页
     ·运行前准备第67-68页
     ·爬虫抓取指令第68页
   ·本系统运行测试第68-73页
     ·爬虫抓取效率的改进验证第68-69页
     ·爬虫多线程抓取性能测试第69-70页
     ·Nutch改进前后检索效率比较第70-71页
     ·系统查询界面第71-73页
第六章 结论第73-75页
   ·主要工作及创新点第73页
   ·研究展望第73-75页
参考文献第75-78页
致谢第78-79页
攻读学位期间发表论文第79页

论文共79页,点击 下载论文
上一篇:分布式环境下谱聚类算法研究
下一篇:基于MapReduce的好友推荐系统的研究与实现