首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web挖掘中超文本分类的研究与实现

摘要第1-4页
ABSTRACT第4-5页
目录第5-7页
第一章 绪论第7-15页
   ·选题背景第7页
   ·研究意义第7-10页
     ·Web挖掘和Web文本分类第7-8页
     ·文本分类的应用第8-10页
   ·研究现状第10-13页
     ·文献综述第10-13页
     ·潜在的研究方向第13页
   ·论文内容安排第13-15页
第二章 Web挖掘概述第15-27页
   ·引言第15页
   ·数据挖掘第15-17页
     ·数据挖掘的概念第15页
     ·数据挖掘的分类第15-17页
   ·Web挖掘第17-25页
     ·Web数据的特点第17-18页
     ·Web挖掘的概念第18-19页
     ·Web挖掘流程第19-20页
     ·Web挖掘分类第20-25页
       ·Web内容挖掘(Web Content Mining)第20-23页
       ·Web结构挖掘(Web Structure Mining)第23-24页
       ·Web使用挖掘(Web Usage Mining)第24-25页
       ·Web挖掘分类总结第25页
   ·本章小结第25-27页
第三章 文本分类第27-49页
   ·引言第27页
   ·文本分类的概念第27-28页
   ·文本分类方法分类第28-29页
   ·文本表示方法第29-30页
     ·向量空间模型的相关概念第29-30页
   ·文本分类的特征抽取第30-32页
   ·文本分类的特征选择第32-37页
     ·特征选择的概念第32-33页
     ·特征选择的类别可分性判据第33页
     ·特征选择的方式第33-34页
     ·常用特征选择方法第34-37页
       ·文档频率(DF)第34页
       ·信息增益(IG)第34-35页
       ·互信息(MI)第35-36页
       ·x~2统计量(CHI)第36页
       ·特征词强度(TS)第36-37页
   ·典型文本分类方法第37-40页
     ·KNN第37-38页
     ·TFIDF第38-39页
     ·Naive Bayes第39-40页
   ·分类评价标准第40-41页
   ·文本分类实验方法第41-42页
   ·基于Lee模型的Naive Bayes分类方法第42-48页
     ·Sanban的文本分类方法第42-44页
     ·我们的方法第44-45页
     ·分类试验第45页
       ·试验数据集第45页
       ·试验方法第45页
     ·试验结果及其分析第45-47页
       ·训练百分比对分类精度的影响第45页
       ·测试文档的部分读策略对分类算法的影响第45-47页
       ·对两种策略下试验结果的解释第47页
     ·结论第47-48页
   ·本章小结第48-49页
第四章 基于规则的超文本分类第49-59页
   ·引言第49页
   ·超文本特点第49-50页
     ·超文本的结构性特点第49-50页
     ·超文本的组成第50页
   ·超文本分类方法第50-51页
   ·基于规则的超文本分类第51-58页
     ·Yiming Yang超文本规则第52页
     ·超文本表示方法第52-53页
     ·分类试验第53-55页
       ·试验数据集第53页
       ·试验步骤第53-54页
       ·预处理和特征提取第54-55页
     ·试验结果及其分析第55-57页
       ·分类精度随表示方法的变化情况第55-56页
       ·运行时间比较第56-57页
     ·结论第57-58页
   ·本章小结第58-59页
第五章 结论和展望第59-61页
   ·论文的工作总结第59-60页
     ·论文的工作第59页
     ·有待改进的地方第59-60页
   ·进一步的研究方向第60-61页
参考文献第61-64页
攻读硕士学位期间发表(或己录用)的学术论文第64-65页
致谢第65-66页
附录1 试验中特征词被去掉的前缀和后缀第66-67页
附录2 试验中选用的停止词表第67-69页
西北工业大学 学位论文知识产权声明书第69页
西北工业大学 学位论文原创性声明第69页

论文共69页,点击 下载论文
上一篇:黄精的种质资源和生物学特性研究
下一篇:综合应用L2TP和IPSec方法研究