首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

关于互联网文本数据挖掘的一些关键技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·研究背景及意义第9-10页
   ·国内外研究现状第10-12页
   ·本文的主要工作第12页
   ·本文的组织结构第12-14页
第二章 互联网文本挖掘概述第14-24页
   ·文本挖掘概述第14-19页
     ·文本挖掘概念第14页
     ·文本挖掘中的问题第14-16页
     ·文本挖掘的流程第16页
     ·文本挖掘的研究内容第16-19页
   ·互联网文本数据挖掘概述第19-23页
     ·互联网文本的结构特征第20-21页
     ·互联网文本挖掘的研究第21-23页
   ·本章小结第23-24页
第三章 基于HtmlParser 的网页数据自动抽取第24-41页
   ·常用的网页数据抽取方法第24-26页
   ·常用的网页数据抽取模型第26-28页
   ·HtmlParser 概述第28-31页
     ·HtmlParser 基本功能第29-30页
     ·HtmlParser 基本数据结构第30-31页
   ·基于HtmlParser 的网页数据自动抽取第31-40页
     ·总体框架第31-32页
     ·数据转换第32-33页
     ·数据抽取第33-35页
     ·数据清洗第35-37页
     ·抽取实验第37-38页
     ·自动抽取实例第38-40页
   ·本章小结第40-41页
第四章 新闻检索结果聚类分析第41-67页
   ·检索结果聚类概述第42-43页
   ·总体框架第43-44页
   ·基于Lucene 的索引数据库第44-50页
     ·Lucene 概述第44-46页
     ·索引的建立第46-48页
     ·数据检索第48-50页
   ·关键短语抽取第50-53页
   ·聚类算法分析第53-63页
     ·检索结果聚类算法第55-56页
     ·文本聚类模型第56-57页
     ·文本聚类的评价第57-58页
     ·基于改进的频繁项集的文本聚类算法第58-63页
   ·类标签提取第63-66页
   ·本章小结第66-67页
第五章 互联网新闻数据在线挖掘服务系统第67-77页
   ·系统开发背景第67-68页
   ·系统的物理结构第68-69页
   ·系统的逻辑结构第69-71页
   ·检索结果聚类分析第71-74页
   ·系统界面效果图第74-76页
     ·新闻检索界面第74页
     ·新闻检索结果聚类界面第74-76页
   ·本章小结第76-77页
第六章 总结与展望第77-79页
致谢第79-80页
参考文献第80-83页
个人简介和攻读硕士期间的成果第83-84页

论文共84页,点击 下载论文
上一篇:商务智能框架中的数据体系结构研究和设计
下一篇:基于DM365的智能视频分析系统的设计与实现