首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向web文本挖掘的主题搜索技术研究

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-12页
   ·课题背景第8-9页
   ·研究现状第9页
   ·课题的研究内容第9-11页
   ·论文的组织结构第11-12页
第二章 Web数据挖掘技术第12-24页
   ·数据挖掘综述第12-14页
     ·定义第12-13页
     ·特征第13页
     ·方法第13-14页
     ·处理过程第14页
   ·Web数据挖掘第14-20页
     ·介绍第14-15页
     ·优点第15-17页
     ·类别第17-19页
     ·基本步骤第19-20页
     ·几种Web数据挖掘方式的对比第20页
   ·Web文本挖掘第20-22页
   ·小结第22-24页
第三章 搜索引擎技术第24-32页
   ·搜索引擎概况第24-25页
     ·概念第24页
     ·搜索引擎的分类第24-25页
   ·搜索引擎的关键技术第25-27页
     ·信息的收集和存储技术第25页
     ·信息的预处理技术第25-26页
     ·信息索引技术第26页
     ·搜索引擎的性能指标第26-27页
   ·搜索引擎的基本模块构成第27-28页
   ·网络爬虫技术第28-31页
     ·概括第28页
     ·性能第28-29页
     ·基本原理第29-30页
     ·实现方式第30-31页
   ·小结第31-32页
第四章 系统中的理论和算法第32-48页
   ·页面主题相似度算法第32-33页
     ·TF-IDF权值第32-33页
     ·相似度计算第33页
   ·链接获取策略第33-40页
     ·HTML结构树第34页
     ·关联上下文第34-36页
     ·建立样本库第36页
     ·性能评价第36-40页
   ·面向主题爬行的非贪婪遗传算法第40-43页
     ·遗传算法第40-41页
     ·链接选择的非贪婪策略第41页
     ·基于非贪婪遗传算法的主题网络爬虫搜索算法第41-42页
     ·性能评价第42-43页
   ·中文分词技术第43-45页
     ·机械分词方法第43-44页
     ·基于理解的分词方法第44页
     ·统计分词方法第44-45页
   ·基于支持向量机的文本分类方法第45-47页
     ·支持向量机与核函数第45-46页
     ·基于SVM的Web文本分类算法第46-47页
   ·小结第47-48页
第五章 系统的设计与实现第48-70页
   ·面向Web文本挖掘的主题搜索系统第48-49页
     ·系统设计的目标第48-49页
     ·Label Studio3 的模块图第49页
   ·多线程网络爬虫第49-55页
     ·网络爬虫的框架第49-50页
     ·Web页面的下载第50-51页
     ·网页解析第51-52页
     ·数据存储第52-53页
     ·协调控制第53-54页
     ·运行实现第54-55页
   ·文本内容挖掘第55-60页
     ·文本内容挖掘的框架第55-56页
     ·语言分词第56-57页
     ·特征抽取第57-58页
     ·内容分类第58-59页
     ·运行实现第59-60页
   ·索引和检索第60-69页
     ·索引检索模块的框架第60-61页
     ·倒排序索引原理第61-62页
     ·建立索引第62-65页
     ·检索功能第65-67页
     ·运行实现第67-69页
   ·小结第69-70页
第六章 总结与展望第70-72页
   ·研究工作的总结第70页
   ·趋势与展望第70-72页
致谢第72-73页
参考文献第73-75页
在读期间发表的学术论文第75-76页

论文共76页,点击 下载论文
上一篇:基于SVM的数据挖掘分类技术研究
下一篇:数字水印及其在数字版权管理系统中的应用研究