首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索引擎聚类算法的研究

摘要第1-4页
ABSTRACT第4-8页
1 引言第8-20页
   ·搜索引擎发展概述第9-12页
     ·搜索引擎的发展史第9-10页
     ·搜索引擎分类第10-11页
     ·主题搜索引擎介绍第11-12页
   ·搜索引擎研究现状第12-15页
     ·国外搜索引擎研究现状第12页
     ·国内搜索引擎研究现状第12-13页
     ·搜索引擎的发展趋势第13-15页
   ·搜索引擎的关键技术第15-16页
     ·信息收集和存储技术第15页
     ·信息预处理技术第15-16页
     ·信息索引技术第16页
   ·搜索引擎的不足第16-17页
   ·研究目的与意义第17页
   ·论文结构介绍第17-20页
2 文本聚类第20-31页
   ·聚类分析的原理第20页
   ·聚类分析方法介绍第20-26页
     ·划分方法第20-22页
     ·层次方法第22-24页
     ·密度方法第24-26页
   ·三种算法比较第26-30页
   ·本章小结第30-31页
3 算法设计第31-53页
   ·网页的预处理第32-38页
     ·内容压缩第32-35页
     ·编码转换第35页
     ·中文分词第35-38页
   ·词频变差主题度计算第38-43页
     ·词频变差的概念第38页
     ·词频变差理论第38-40页
     ·词频变差算法流程第40-43页
   ·相似度计算第43-47页
     ·倒排索引第43-44页
     ·主题度计算第44-45页
     ·相似度计算第45-47页
     ·主题词提取第47页
   ·文本聚类第47-52页
     ·最优密度聚类算法第48页
     ·输入参数ε的求解第48-51页
     ·算法流程第51-52页
   ·本章小结第52-53页
4 搜索引擎的实现第53-71页
   ·主题爬虫程序设计第54-57页
     ·爬虫基本结构第54-55页
     ·爬虫抓取流程第55-56页
     ·提高爬虫效率第56-57页
   ·信息处理模块第57-61页
     ·文本处理第58-61页
     ·文本聚类实现第61页
   ·查询功能模块第61-66页
     ·查询处理第63页
     ·结果显示第63-65页
     ·查看相关第65-66页
   ·数据库设计第66-68页
     ·MySQL数据库介绍第66页
     ·数据库设计第66-68页
   ·主题搜索引擎的性能测试第68-70页
     ·测试环境和测试任务第68-69页
     ·结果比较第69-70页
   ·本章小结第70-71页
5 主题搜索引擎在林业领域的应用第71-76页
   ·FTSE的结构第71-72页
   ·FTSE系统运行第72页
   ·FTSE系统初始化第72-73页
   ·主题更新第73页
     ·种子站点的更新第73页
     ·主题词表的更新第73页
   ·测试结果第73-74页
   ·本章小结第74-76页
6 总结与展望第76-78页
   ·总结第76-77页
   ·展望第77-78页
参考文献第78-81页
个人简介第81-82页
导师简介第82-83页
获得成果目录清单第83-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:木质生物质预处理、组分分离及酶解糖化研究
下一篇:基于风险区划的中国森林保险区域化发展研究