首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的多层Web文本分类技术研究

摘要第3-5页
Abstract第5-6页
第一章 绪论第13-21页
    1.1 课题背景与意义第13-14页
    1.2 国内外研究现状第14-19页
        1.2.1 Web文本信息抽取与分类研究现状第14-17页
        1.2.2 存在的问题第17页
        1.2.3 本文的主要研究内容第17-19页
    1.3 本文的工作与安排第19-21页
第二章 相关技术基础第21-33页
    2.1 Web文本信息抽取及预处理技术第21-27页
    2.2 文本表示第27-28页
    2.3 多层文本分类技术第28-31页
    2.4 本章小结第31-33页
第三章 基于DOM树的Web文本信息层次化抽取算法第33-43页
    3.1 引言第33页
    3.2 基于超链接和DOM树的Web标题抽取第33-38页
        3.2.1 目录型网页标题抽取第34-36页
        3.2.2 主题型网页标题抽取第36-38页
    3.3 基于DOM树的Web正文内容抽取第38-40页
    3.4 实验结果与分析第40-42页
    3.5 本章小结第42-43页
第四章 基于语义的多层次Web文本分类第43-56页
    4.1 知识库的构建第43-46页
        4.1.1 多层次分类知识库的构建第43-45页
        4.1.2 领域知识库的构建第45-46页
    4.2 基于知网的语义相似度计算第46-49页
        4.2.1 词语语义相似度计算第47-48页
        4.2.2 文本语义相似度计算第48-49页
    4.3 自底向上逐层训练第49-50页
    4.4 自顶向下多层次文本分类算法第50-53页
        4.4.1 基于标题规则的文本分类算法第51页
        4.4.2 基于语义的文本相似度分类算法第51-53页
    4.5 实验结果与分析第53-55页
    4.6 本章小结第55-56页
第五章 总结与展望第56-58页
    5.1 论文总结第56页
    5.2 工作展望第56-58页
参考文献第58-62页
致谢第62-63页
攻读硕士学位期间发表的学术论文第63-64页
攻读硕士学位期间参加的科研项目第64页

论文共64页,点击 下载论文
上一篇:抑制法尼基焦磷酸合成酶改善心脏重塑作用的研究
下一篇:Galectin-3和肝衰竭预后相关性的研究