首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎的研究与实现

摘要第1-5页
Abstract第5-9页
1 绪论第9-16页
   ·课题背景和论文组织第9-10页
   ·搜索引擎的发展状况第10-11页
   ·搜索引擎原理第11-12页
   ·搜索引擎现有模型第12-13页
   ·搜索引擎评价原则和发展趋势第13-15页
   ·小结第15-16页
2 搜索引擎的核心技术第16-34页
   ·网页抓取下载技术第17-20页
     ·网络蜘蛛第17-18页
     ·网络蜘蛛的设计实现原理第18-19页
     ·网页采集程序的实现第19-20页
   ·资源文件预处理分析技术第20-23页
     ·网页预处理分析处理第21-22页
     ·其他文档预处理分析第22-23页
     ·基于Nutch文档的分析第23页
   ·文档内容分析与分词处理第23-28页
     ·文档内容分析过程第23-25页
     ·分词技术第25页
     ·常用的分词算法第25-27页
     ·中文分词中的歧义第27-28页
   ·索引和检索技术第28-31页
     ·索引的基本结构第29-30页
     ·索引程序的设计第30-31页
     ·检索程序的设计实现第31页
   ·小结第31-34页
3 垂直搜索引擎第34-41页
   ·垂直搜索引擎的发展和原理第34-35页
   ·垂直搜索引擎的设计框架第35-36页
   ·专题信息的抓取下载第36-37页
   ·算法分析第37-40页
     ·Google的pagerank正算法第37-39页
     ·HITS第39-40页
   ·小结第40-41页
4 面向能源的垂直搜索引擎的系统设计第41-53页
   ·面向能源的垂直搜索引擎需求第41-42页
     ·能源的重要性第41-42页
     ·能源效益和节能第42页
     ·能源与国民经济第42页
   ·HITS算法及其改进在垂直搜索引擎中的应用第42-43页
   ·基于Nutch的有效搜索引擎的设计第43-50页
     ·网页预处理分析第43-46页
     ·JE分词第46-48页
     ·专题训练集第48-49页
     ·锚文本和标题信息过滤 URL形成集合 E第49-50页
     ·E中authority值和hub值的计算和网页排序第50页
   ·算法设计策略描述第50-51页
   ·检索的实现第51-52页
   ·界面设计第52页
   ·小结第52-53页
5 系统引擎的实现及数据分析第53-57页
   ·测试环境的搭建过程第53-54页
     ·在windows环境下配置和安装Nutch-0.9第53-54页
     ·在Eclipse中加载nutch第54页
   ·垂直搜索引擎的衡量标准第54-55页
   ·实验数据分析对比第55-56页
   ·小结第56-57页
结论第57-58页
参考文献第58-62页
攻读硕士学位期间发表学术论文情况第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:基于虚拟样机技术的过山车仿真研究
下一篇:扩散熵和概率流的经验模式分解模型