首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

一种基于机器学习的主题Web分类算法研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第13-18页
    1.1 研究背景第13-14页
    1.2 国内外研究综述第14-15页
    1.3 研究意义第15页
    1.4 研究内容第15-16页
    1.5 论文组织结构第16-18页
第2章 文本分类的概述第18-29页
    2.1 文本分类定义第18页
    2.2 文本分类的流程第18-20页
    2.3 中文分词技术第20-23页
        2.3.1 中文分词的思想第20页
        2.3.2 中文分词系统第20-21页
        2.3.3 特征降维方法第21-23页
    2.4 文本分类的模型第23-25页
        2.4.1 布尔模型第23-24页
        2.4.2 向量空间模型第24-25页
    2.5 机器学习算法第25-28页
        2.5.1 K-最近邻算法第25-26页
        2.5.2 支持向量机算法第26-27页
        2.5.3 朴素贝叶斯算法第27页
        2.5.4 PageRank算法第27页
        2.5.5 HITS算法第27-28页
    2.6 本章小结第28-29页
第3章 基于网页结构和链接建模第29-38页
    3.1 特征提取方法介绍第29-31页
        3.1.1 文档频数(TF-IDF)第29页
        3.1.2 信息增益(IG(t,c))第29页
        3.1.3 文本中单词t的期望交叉熵(CrossEntryTxt)第29-30页
        3.1.4 互信息(MI)第30页
        3.1.5 Χ~2估计(CHI)第30-31页
    3.2 改进的权重计算方法第31-33页
        3.2.1 经典的权重计算方法第31-32页
        3.2.2 改进的权重计算方法第32-33页
    3.3 基于链接分析的模型改进第33-37页
        3.3.1 HITS算法第33-34页
        3.3.2 Rocchio算法第34-35页
        3.3.3 提出HR-VSM模型第35-37页
    3.4 本章小结第37-38页
第4章 基于机器学习的web分类算法的研究第38-44页
    4.1 网页文本的预处理第38-39页
    4.2 特征提取第39-40页
        4.2.1 特征提取的步骤第39-40页
    4.3 基于HR-VSM模型的文本表示和时间复杂度第40页
    4.4 使用支持向量机进行文本分类第40-43页
        4.4.1 文本分类的评价第40-41页
        4.4.2 各分类算法比较第41页
        4.4.3 支持向量机算法描述第41-43页
        4.4.4 网页文本分类过程第43页
    4.5 本章小结第43-44页
第5章 仿真实验第44-54页
    5.1 Web文本分类系统的设计第44-45页
        5.1.1 基于HR-VSM和SVM的分类算法原理第45页
    5.2 仿真实验第45-49页
        5.2.1 实验环境第46页
        5.2.2 基于HR-VSM和SVM在文本分类中的预测步骤及仿真实验第46-49页
    5.3 仿真的实验评价第49-53页
    5.4 本章小结第53-54页
总结与展望第54-55页
    总结第54页
    展望第54-55页
参考文献第55-58页
致谢第58-59页
附录 A 攻读学位期间完成的主要成果第59-60页
附录 B 攻读硕士期间参与的科研项目第60页

论文共60页,点击 下载论文
上一篇:基于分子印迹聚合物的电化学传感器对药物分子的检测
下一篇:基于免疫计算的低辐射3G网络基站选址优化研究