首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于图模型的Web文档分类方法研究

摘要第1-6页
Abstract第6-9页
1 绪论第9-16页
   ·课题的研究背景第9-10页
     ·Web 文档分类的背景第9页
     ·文本分类的意义第9页
     ·Web 文档分类的提出第9-10页
   ·国内外研究现状及意义第10-13页
     ·现实意义第10-12页
     ·理论意义第12-13页
   ·课题的提出第13-15页
     ·现有文档分类的算法第13-14页
     ·向量空间模型的特点第14页
     ·图模型提出第14-15页
   ·课题的主要工作第15页
   ·论文的结构和组织第15-16页
2 文本分类关键技术的研究第16-30页
   ·文本分类的意义第16页
   ·文本的词频统计第16-20页
     ·中文分词第16-18页
     ·语料库的预处理及结果第18-20页
   ·特征选择方法的比较第20-27页
     ·文档频率法第20页
     ·信息增益法第20-21页
     ·开方检验法第21-23页
     ·互信息法第23-24页
     ·论文中的特征选择结果第24-27页
   ·特征权重计算方法的研究与改进第27-30页
     ·布尔权重法第27-28页
     ·TF 权重第28页
     ·IDF 权重第28页
     ·TF.IDF 权重第28-29页
     ·TF-IDF-IG第29页
     ·改进后的(TF-IDF-IG)_(ij)公式第29-30页
3 文档分类算法模型的研究与比较第30-35页
   ·贝叶斯模型第30-31页
   ·支持向量机SVM第31-32页
   ·KNN 算法第32-33页
   ·决策树算法第33-35页
4 文本表示方法的研究第35-40页
   ·布尔模型第35页
   ·概率模型第35-36页
   ·向量空间模型第36-38页
   ·图模型第38-40页
5 图模型算法的设计与实现第40-56页
   ·图的表示方法第40-44页
     ·图的定义第40页
     ·图的建立方法第40-44页
     ·图相似性的度量第44页
   ·基于图模型的文本相似度的计算第44-47页
     ·最大公共子图的算法第44-46页
     ·特征加权法计算相似系数第46页
     ·图模型的文档分类算法第46-47页
   ·算法实现第47-53页
     ·课题的研究步骤第47-49页
     ·实验测试的数据集第49-53页
   ·实验结果及分析第53-56页
结论第56-57页
参考文献第57-61页
在学研究成果第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:关联规则挖掘在电子病历分析中的应用研究
下一篇:基于数据挖掘图书馆管理决策研究