首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于垂直搜索引擎的文本挖掘系统研究与实现

摘要第1-5页
Abstract第5-7页
目录第7-9页
图目录第9-10页
表目录第10-11页
第一章 绪论第11-17页
   ·研究背景与意义第11-12页
   ·国内外研究现状分析第12-15页
     ·垂直搜索引擎相关研究分析第12-14页
     ·文本挖掘相关研究分析第14-15页
   ·论文的组织结构第15-17页
第二章 垂直搜索引擎技术剖析第17-29页
   ·通用搜索引擎第17-20页
     ·网络爬虫第18-20页
     ·索引器第20页
     ·检索器第20页
   ·Heritrix和Lucene概述第20-25页
     ·基于Heritrix的垂直网络爬虫第20-21页
     ·基于Lucene的索引器和搜索器第21-24页
     ·在Lucene中使用ICTCLAS第24-25页
   ·垂直搜索引擎第25-27页
     ·垂直搜索引擎与通用搜索引擎的区别第25-26页
     ·垂直搜索引擎中网络爬虫的关键技术第26-27页
   ·本章小结第27-29页
第三章 文本挖掘相关技术第29-43页
   ·中文文本表示技术第29-31页
     ·文本特征表示第29-30页
     ·特征提取第30-31页
   ·文本聚类第31-37页
     ·基于层次的聚类算法第32页
     ·基于划分的聚类算法第32-34页
     ·基于密度的聚类算法第34页
     ·基于网格的聚类算法第34-35页
     ·经典的single-pass聚类算法第35-36页
     ·对各种聚类算法的比较与总结第36-37页
   ·对经典single-pass算法改进第37-38页
   ·文本聚类结果分析第38-39页
   ·实验结果与分析第39-42页
     ·聚类结果第39-41页
     ·热点评分与类标题生成第41-42页
   ·本章小结第42-43页
第四章 基于垂直搜索引擎的文本挖掘系统设计第43-55页
   ·系统总体设计第43-45页
     ·功能需求第43页
     ·模块组成第43-45页
   ·文本信息采集模块的详细设计第45-47页
     ·配置文件读取模块第45-46页
     ·网络爬虫模块第46-47页
   ·文本信息预处理模块的详细设计第47-49页
     ·网页信息结构化模块第47-48页
     ·中文分词模块第48-49页
   ·文本信息挖掘模块的详细设计第49-51页
     ·聚类分析模块第49-50页
     ·热点评分模块第50-51页
   ·文本信息服务模块的详细设计第51-53页
     ·垂直搜索引擎模块第52页
     ·文本信息展示模块第52-53页
   ·本章小结第53-55页
第五章 基于垂直搜索引擎的文本挖掘系统实现第55-65页
   ·开发环境及系统部署第55-57页
   ·文本信息采集模块的实现第57-58页
   ·文本信息预处理模块的实现第58-60页
   ·文本信息挖掘模块的实现第60-62页
   ·文本信息服务模块的实现第62-63页
   ·本章小结第63-65页
第六章 总结与展望第65-67页
   ·论文总结第65页
   ·研究展望第65-67页
参考文献第67-70页
致谢第70-71页
攻读硕士学位期间主要的研究成果第71页

论文共71页,点击 下载论文
上一篇:基于LDA的文本聚类在高校网络舆情分析中的应用研究
下一篇:大型多人在线游戏中负载均衡及相关技术的研究