摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 概述 | 第11-17页 |
1.1 课题研究背景和意义 | 第11页 |
1.2 课题主要内容 | 第11-13页 |
1.3 相关课题国内外研究现状 | 第13-15页 |
1.3.1 文本特征提取相关研究现状 | 第13页 |
1.3.2 文本关联分析相关研究现状 | 第13-14页 |
1.3.3 文本分类相关研究现状 | 第14页 |
1.3.4 价值预测相关研究现状 | 第14-15页 |
1.4 论文的组织结构 | 第15-17页 |
第二章 关键技术 | 第17-33页 |
2.1 文本挖掘概述 | 第17页 |
2.2 网络爬虫技术概述 | 第17-19页 |
2.3 文本预处理相关技术 | 第19-23页 |
2.3.1 分词技术 | 第19-20页 |
2.3.2 文本过滤 | 第20页 |
2.3.3 特征提取 | 第20-23页 |
2.4 文本关联关系分析相关技术 | 第23-26页 |
2.4.1 文本的相似性度量 | 第23-25页 |
2.4.2 文本的重复性度量 | 第25-26页 |
2.5 文本分类相关技术 | 第26-31页 |
2.5.1 文本分类的定义 | 第26页 |
2.5.2 文本分类的一般流程 | 第26页 |
2.5.3 文本分类的常用方法 | 第26-30页 |
2.5.4 分类结果评估 | 第30-31页 |
2.6 人工神经网络相关技术 | 第31-32页 |
2.7 本章小结 | 第32-33页 |
第三章 新闻的相似度及重复性检测 | 第33-49页 |
3.1 新闻相似度及重复性检测的意义及应用范围 | 第33页 |
3.2 基于余弦算法的新闻的相似性检测 | 第33-40页 |
3.2.1 新闻相似度量的系统结构 | 第34页 |
3.2.2 文本预处理 | 第34-36页 |
3.2.3 新闻相似性检测算法的分析 | 第36-37页 |
3.2.4 新闻相似度检测的实验结果分析 | 第37-40页 |
3.3 一种基于MinEDD算法的新闻重复性检测 | 第40-45页 |
3.3.1 MinEDD算法的提出 | 第40-43页 |
3.3.2 应用MinEDD算法进行新闻重复性检测的流程 | 第43-44页 |
3.3.3 MinEDD算法在新闻重复性度量中的应用 | 第44-45页 |
3.4 相似性检测与重复性检测的对比分析 | 第45-48页 |
3.5 本章小结 | 第48-49页 |
第四章 基于BT-ED-SVM的新闻分类 | 第49-61页 |
4.1 新闻文本分类的意义 | 第49页 |
4.2 新闻文本分类的流程 | 第49页 |
4.3 支持向量机多分类方法分析以及改进 | 第49-54页 |
4.3.1 多分类组合策略的分析 | 第49-52页 |
4.3.2 基于类距离的二叉树多分类组合策略 | 第52-54页 |
4.4 改进的支持向量机的新闻文本分类器的实现 | 第54-59页 |
4.4.1 SVM多分类新闻文本分类系统架构图 | 第54-55页 |
4.4.2 文本采集及数字化模块 | 第55-56页 |
4.4.3 最优二叉树结构的构建模块 | 第56-57页 |
4.4.4 构造分类器模块 | 第57-59页 |
4.5 实验结果分析 | 第59-60页 |
4.5.1 本文改进算法与其他传统算法的比较分析 | 第59页 |
4.5.2 SVM多分类实验结果分析 | 第59-60页 |
4.6 本章小结 | 第60-61页 |
第五章 基于BP神经网络时间序列的新闻价值预测 | 第61-72页 |
5.1 新闻价值评估的标准及意义 | 第61页 |
5.2 新闻价值预测模型的系统设计 | 第61-62页 |
5.3 新闻价值定义及时间序列数据采集 | 第62-64页 |
5.4 应用BP神经网络进行新闻时间序列的价值预测 | 第64-71页 |
5.4.1 BP神经网络用于时间序列预测的理论基础 | 第64-65页 |
5.4.2 BP神经网络的建立 | 第65-69页 |
5.4.3 训练样本数据的预处理 | 第69页 |
5.4.4 价值预测模型的结果及分析 | 第69-71页 |
5.5 本章小结 | 第71-72页 |
第六章 互联网新闻的服务与管理系统的实现 | 第72-96页 |
6.1 项目背景与需求分析 | 第72-73页 |
6.2 系统开发环境 | 第73-74页 |
6.2.1 系统硬件拓扑架构 | 第73-74页 |
6.2.2 系统软件配置 | 第74页 |
6.3 系统设计与实现 | 第74-93页 |
6.3.1 新闻关联分析模块 | 第75-83页 |
6.3.2 新闻分类模块 | 第83-89页 |
6.3.3 新闻价值预测模块 | 第89-93页 |
6.4 系统测试 | 第93-95页 |
6.4.1 功能测试 | 第93-94页 |
6.4.2 性能测试 | 第94-95页 |
6.5 本章小结 | 第95-96页 |
第七章 总结与展望 | 第96-98页 |
致谢 | 第98-99页 |
参考文献 | 第99-102页 |
攻硕期间取得的研究成果 | 第102-103页 |