首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web数据挖掘及其在网络新闻文本数据中的应用

摘要第1-5页
Abstract第5-10页
第一章 引言第10-16页
   ·研究背景及意义第10-14页
     ·Web 挖掘第10-11页
     ·网页去重第11-13页
     ·文本分类第13-14页
   ·本文的主要工作第14页
   ·本文的章节安排第14-16页
第二章 基于文本的 Web 挖掘概述第16-26页
   ·Web 挖掘概述第16-20页
     ·产生背景第16页
     ·主要任务第16-17页
     ·相关学科第17页
     ·Web 挖掘分类第17-20页
   ·超文本挖掘概述第20-26页
     ·相关表示模型第20-22页
     ·有指导学习第22页
     ·无指导学习第22页
     ·半指导学习第22-23页
     ·社交网络分析第23-26页
第三章 基于 MinApriori 度量的网页相似度检测第26-44页
   ·Web 挖掘的基本过程第26页
   ·Web 信息采集第26-30页
     ·信息采集的基本原理第26-27页
     ·信息采集器的基本结构第27-29页
     ·Web 信息采集的实现第29-30页
   ·Web 信息抽取第30-33页
     ·常用的 Web 信息抽取方法第30-32页
     ·Web 信息抽取实现第32-33页
   ·中英文分词第33-36页
     ·三种常用中文分词方法第33-35页
     ·三种分词方法的优劣对比第35-36页
     ·英文分词第36页
   ·基于 MinApriori 相似度度量的网页重复检测第36-44页
     ·常用重复检测方法分类第36页
     ·基于语义方法的常见相似度度量第36-38页
     ·MinApriori 方法第38-40页
     ·MinApriori 度量第40-41页
     ·MinApriori 度量和其他度量的比较第41-42页
     ·基于MinApriori 度量的相似度检测方法及其在新闻网页中的应用第42-44页
第四章 基于 ComplementNaiveBayes 的新闻分类第44-72页
   ·文本分类概述第44-47页
     ·文本分类定义第44页
     ·文本分类的种类第44-45页
     ·文本分类的评估第45-47页
   ·文本分类的基本流程第47页
   ·常用文本分类算法第47-60页
     ·基于贝叶斯理论的分类算法第47-55页
     ·基于 SVM 的分类算法第55-57页
     ·基于实例学习的分类算法第57-58页
     ·基于决策树的分类算法第58-59页
     ·基于规则的分类算法第59-60页
   ·常用文本分类算法的比较第60-65页
   ·属性降维第65-67页
     ·用于降维的常用函数第65-67页
   ·降维试验第67-68页
   ·基于 ComplementNaiveBayes 新闻自动分类系统第68-72页
第五章 网络新闻在线挖掘服务系统的实现第72-80页
   ·系统开发背景第72-73页
   ·硬件拓扑结构第73-75页
   ·系统体系结构第75-76页
   ·在线挖掘服务模块架构第76-78页
   ·系统界面效果图第78-80页
     ·新闻自动分类界面第78-79页
     ·相似性检测界面第79-80页
第六章 总结与展望第80-82页
致谢第82-83页
参考文献第83-86页

论文共86页,点击 下载论文
上一篇:基于GPU的超大规模地形实时绘制技术
下一篇:北京车管所档案管理系统分析与设计