首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于机器学习算法的Web文本挖掘应用研究

中文摘要第1-4页
Abstract第4-7页
第一章 绪论第7-12页
   ·研究背景与意义第7-8页
   ·数据挖掘技术第8-11页
     ·数据挖掘的定义第8页
     ·数据挖掘的对象第8页
     ·数据挖掘的特点第8-9页
     ·数据挖掘的过程第9-10页
     ·数据挖掘的常见任务第10页
     ·数据挖掘算法的分类第10页
     ·数据挖掘算法的体系第10-11页
   ·本文的研究工作及内容安排第11-12页
第二章 课题中的相关技术第12-30页
   ·HABM第12-13页
   ·支持向量机第13-17页
     ·支持向量机概述第13页
     ·标准支持向量分类机第13-16页
     ·支持向量机的特点与优势第16-17页
   ·文本聚类概述第17-21页
     ·含义及作用第17页
     ·文本聚类算法简介第17-19页
     ·K-Means聚类算法第19-20页
     ·聚类结果的评测第20-21页
   ·Web文本处理第21-29页
     ·基于Web文本的挖掘模型第21-22页
     ·中文分词第22-24页
     ·TF-IDF向量空间模型第24-26页
     ·对象串行化第26-29页
   ·本章小结第29-30页
第三章 Web文本热点抽取系统第30-44页
   ·设计思想第30页
   ·算法说明第30-31页
   ·系统处理流程第31-33页
   ·关键模块解析第33-41页
     ·磁盘散列文件第33-35页
     ·文章分词及索引第35-37页
     ·HABM的相关计算第37-40页
     ·热点筛选第40-41页
   ·系统环境第41页
   ·参数选择及真实数据运行结果第41-43页
     ·系统运行截图第41-42页
     ·参数选择第42页
     ·真实数据抽取结果举例第42-43页
   ·本章小结第43-44页
第四章 Web文本分类系统第44-57页
   ·算法与思想第44-46页
   ·系统结构第46-47页
   ·LibSVM的修改与使用第47-54页
     ·转换数据格式第48-49页
     ·缩放数据第49页
     ·尝试分类核函数第49-51页
     ·利用交叉验证获得最佳参数第51-52页
     ·训练分类模型第52-53页
     ·预测未知数据第53-54页
   ·系统环境第54-55页
   ·参数选择及真实数据运行结果第55-56页
     ·系统运行截图第55页
     ·参数选择第55-56页
     ·真实数据分类结果举例第56页
   ·本章小结第56-57页
第五章 Web文本聚类系统第57-67页
   ·K-Means算法的改进第57-59页
   ·系统结构第59-60页
   ·关键模块解析第60-63页
     ·TF-IDF二进制索引文件第60-61页
     ·改进版K-Means实现第61-63页
   ·系统环境第63-64页
   ·参数选择及真实数据运行结果第64-66页
     ·系统运行截图第64页
     ·参数选择第64-65页
     ·真实数据聚类结果举例第65-66页
   ·本章小结第66-67页
第六章 总结与展望第67-69页
   ·本文总结第67页
   ·课题展望第67-69页
参考文献第69-71页
发表论文和科研情况说明第71-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:基于案例检索的语义Web服务组合
下一篇:地震信息共享和可视化平台研究