首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web文本挖掘的研究

摘要第1-5页
Abstract第5-8页
第一章 绪论第8-13页
   ·数据挖掘第8页
   ·Web 数据挖掘第8-10页
     ·Web 挖掘的过程第8页
     ·Web 的特点第8-9页
     ·Web 数据挖掘的目标第9-10页
   ·Web 文本挖掘系统体系结构第10-11页
   ·Web 文本挖掘的意义第11页
   ·Web 文本挖掘的应用第11-12页
   ·本文组织结构第12页
   ·小结第12-13页
第二章 Web 文本预处理第13-21页
   ·文本提取第13页
   ·文本形式化处理第13页
   ·分词第13-17页
     ·正向最大匹配算法(maximum match)第14-15页
     ·逆向最大匹配算法第15-16页
     ·基于统计的最短路径分词算法第16-17页
     ·无词典的分词方法第17页
   ·Web 文本特征表示第17-18页
   ·文本特征选择第18-20页
     ·信息增益第18-19页
     ·互信息第19页
     ·χ~2(CHI)统计第19-20页
   ·本章小结第20-21页
第三章 Web 文本数据挖掘第21-36页
   ·Web 文本分类第21-22页
     ·文本分类的两种类型第21-22页
     ·文本分类的两种方式第22页
   ·常用的方法第22-27页
     ·Rocchio 方法-相似度计算方法第22-24页
     ·Naive Bayes-朴素贝叶斯分类第24页
     ·K 近邻文本分类法(KNN)第24-25页
     ·支持向量机分类(SVM)第25页
     ·决策树方法(Decision Tree)第25-26页
     ·神经网络分类方法(Neural Networks)第26-27页
   ·阈值选择策略第27-28页
   ·Web 文本分类流程第28页
   ·评估方法第28-29页
   ·Web 文本聚类第29-30页
   ·Web 文本聚类方法第30-34页
     ·划分聚类法第30-31页
     ·k-均值聚类第31-32页
     ·对分k-平均法(Bisection k-means)第32页
     ·层次聚类法第32-34页
   ·聚类的评估第34-35页
   ·小结第35-36页
第四章基于属性加权的web 文本分类第36-42页
   ·引言第36页
   ·贝叶斯分类基本思想第36页
   ·贝叶斯定理第36-37页
   ·朴素贝叶斯文本分类模型第37-39页
     ·模型构建第37页
     ·参数估计第37-38页
     ·分类第38页
     ·加权朴素贝叶斯Web 文本分类第38-39页
   ·基于加权朴素贝叶斯的分类算法第39-40页
   ·分类结果评估第40页
   ·实验测试与分析第40-41页
   ·小结第41-42页
第五章 一种改进的支持向量机Web 文本分类第42-48页
   ·引言第42页
   ·支持向量机简介第42页
   ·支持向量第42-44页
   ·支持向量机分类方法第44页
   ·改进的分类方法第44-46页
   ·实验及分析第46-47页
   ·小结第47-48页
第六章总结和展望第48-49页
   ·全文总结第48页
   ·展望第48-49页
参考文献第49-52页
致谢第52-53页

论文共53页,点击 下载论文
上一篇:基于嵌入式系统的罗汉果种属识别研究
下一篇:基于WEB的体育理论试题库的初步研究与开发--以广西师大体育学院为例