首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

一种基于半监督学习的实体集合扩展方法研究

摘要第5-7页
Abstract第7-8页
目录第9-11页
第1章 绪论第11-16页
    1.1 研究背景、现状与意义第11-13页
        1.1.1 研究背景第11页
        1.1.2 研究现状第11-13页
        1.1.3 研究意义第13页
    1.2 本文工作第13-15页
    1.3 本文结构第15-16页
第2章 相关工作第16-26页
    2.1 实体集合扩展技术的研究现状第16-17页
        2.1.1 基于分布统计的实体集合扩展方法第16-17页
        2.1.2 基于语义信息的实体集合扩展方法第17页
    2.2 包装器(Wrapper)研究现状第17-19页
    2.3 主题识别的研究现状第19-22页
        2.3.1 LDA模型第19-21页
        2.3.2 Gibbs抽样第21-22页
    2.4 器学习领域的相关研究第22-26页
第3章 基于半监督学习的实体集合扩展方法第26-44页
    3.1 问题描述第26页
    3.2 算法整体流程第26-28页
    3.3 文档数据的获取与清洗第28-36页
        3.3.1 网络爬虫的基本原理第28-29页
        3.3.2 数据清洗第29-36页
    3.4 候选词的抽取与过滤第36-37页
    3.5 词列表的构建第37-39页
    3.6 利用LDA提取词列表语义信息第39-40页
    3.7 标签传播第40-44页
        3.7.1 标签传播算法的基本原理第40-41页
        3.7.2 标签传播算法的具体应用第41-44页
第4章 实验数据及结果评估第44-49页
    4.1 网页正文内容抽取方法评估第44-45页
    4.2 基准实验及评价方法第45页
    4.3 结果分析与评估第45-49页
第5章 总结及展望第49-51页
    5.1 本文总结第49页
    5.2 未来的工作第49-51页
参考文献第51-56页
致谢第56-57页
攻读硕士学位期间发表的论文第57页

论文共57页,点击 下载论文
上一篇:面向日志分类的蚁群聚类算法研究
下一篇:基于离散萤火虫的数据仓库ETL调度优化研究