基于机器学习算法的Web文本挖掘应用研究

中文摘要	第1-4页
Abstract	第4-7页
第一章绪论	第7-12页
·研究背景与意义	第7-8页
·数据挖掘技术	第8-11页
·数据挖掘的定义	第8页
·数据挖掘的对象	第8页
·数据挖掘的特点	第8-9页
·数据挖掘的过程	第9-10页
·数据挖掘的常见任务	第10页
·数据挖掘算法的分类	第10页
·数据挖掘算法的体系	第10-11页
·本文的研究工作及内容安排	第11-12页
第二章课题中的相关技术	第12-30页
·HABM	第12-13页
·支持向量机	第13-17页
·支持向量机概述	第13页
·标准支持向量分类机	第13-16页
·支持向量机的特点与优势	第16-17页
·文本聚类概述	第17-21页
·含义及作用	第17页
·文本聚类算法简介	第17-19页
·K-Means聚类算法	第19-20页
·聚类结果的评测	第20-21页
·Web文本处理	第21-29页
·基于Web文本的挖掘模型	第21-22页
·中文分词	第22-24页
·TF-IDF向量空间模型	第24-26页
·对象串行化	第26-29页
·本章小结	第29-30页
第三章 Web文本热点抽取系统	第30-44页
·设计思想	第30页
·算法说明	第30-31页
·系统处理流程	第31-33页
·关键模块解析	第33-41页
·磁盘散列文件	第33-35页
·文章分词及索引	第35-37页
·HABM的相关计算	第37-40页
·热点筛选	第40-41页
·系统环境	第41页
·参数选择及真实数据运行结果	第41-43页
·系统运行截图	第41-42页
·参数选择	第42页
·真实数据抽取结果举例	第42-43页
·本章小结	第43-44页
第四章 Web文本分类系统	第44-57页
·算法与思想	第44-46页
·系统结构	第46-47页
·LibSVM的修改与使用	第47-54页
·转换数据格式	第48-49页
·缩放数据	第49页
·尝试分类核函数	第49-51页
·利用交叉验证获得最佳参数	第51-52页
·训练分类模型	第52-53页
·预测未知数据	第53-54页
·系统环境	第54-55页
·参数选择及真实数据运行结果	第55-56页
·系统运行截图	第55页
·参数选择	第55-56页
·真实数据分类结果举例	第56页
·本章小结	第56-57页
第五章 Web文本聚类系统	第57-67页
·K-Means算法的改进	第57-59页
·系统结构	第59-60页
·关键模块解析	第60-63页
·TF-IDF二进制索引文件	第60-61页
·改进版K-Means实现	第61-63页
·系统环境	第63-64页
·参数选择及真实数据运行结果	第64-66页
·系统运行截图	第64页
·参数选择	第64-65页
·真实数据聚类结果举例	第65-66页
·本章小结	第66-67页
第六章总结与展望	第67-69页
·本文总结	第67页
·课题展望	第67-69页
参考文献	第69-71页
发表论文和科研情况说明	第71-72页
致谢	第72页