首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向机构官网的数据抽取研究

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-16页
    1.1 课题来源第9页
    1.2 课题背景与研究意义第9-10页
    1.3 国内外研究现状第10-12页
        1.3.1 网页分类第10-11页
        1.3.2 网页信息抽取第11-12页
    1.4 主要研究内容第12-14页
    1.5 论文组织结构第14-16页
第2章 相关理论基础第16-21页
    2.1 网页分类方法第16-17页
        2.1.1 特征选择第16-17页
        2.1.2 分类方法第17页
    2.2 网页信息抽取方法第17-19页
        2.2.1 基于模式的网页信息抽取第18页
        2.2.2 基于领域本体的网页信息抽取第18-19页
        2.2.3 基于机器学习的网页信息抽取第19页
    2.3 评价指标第19-20页
    2.4 本章小结第20-21页
第3章 结合内容与结构特征的网页分类第21-40页
    3.1 数据集构建第21-24页
        3.1.1 大规模数据采集及预处理第21-22页
        3.1.2 数据集构建与分析第22-24页
    3.2 网页特征分析第24-34页
        3.2.1 主体信息区块定位第25-28页
        3.2.2 网页结构特征第28-30页
        3.2.3 网页内容特征第30-34页
    3.3 网页分类模型构建第34-38页
        3.3.1 人工神经网络第35-36页
        3.3.2 决策树第36-37页
        3.3.3 支持向量机第37-38页
    3.4 本章小结第38-40页
第4章 面向类别的网页信息抽取第40-48页
    4.1 信息抽取数据集构建第40-41页
    4.2 基于触发规则的信息抽取第41-44页
        4.2.1 数据分析第41-42页
        4.2.2 信息抽取触发词库构建第42页
        4.2.3 文本词性标注第42-43页
        4.2.4 信息抽取规则库构建第43页
        4.2.5 算法描述第43-44页
    4.3 基于LSTM的信息抽取第44-47页
        4.3.1 数据分析第44页
        4.3.2 文本处理及标注第44-45页
        4.3.3 LSTM模型第45-46页
        4.3.4 抽取算法描述第46-47页
    4.4 本章小结第47-48页
第5章 实验结果分析第48-56页
    5.1 网页分类实验结果第48-52页
        5.1.1 特征提取结果第48-49页
        5.1.2 模型分类结果第49-50页
        5.1.3 模型参数调优第50-51页
        5.1.4 特征选择实验结果第51-52页
    5.2 网页抽取实验结果第52-55页
        5.2.1 基于触发规则的信息抽取实验结果第52-54页
        5.2.2 基于LSTM的信息抽取实验结果第54-55页
    5.3 本章小结第55-56页
结论第56-58页
参考文献第58-61页
攻读学位期间发表的学术论文第61-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:基于高频和瓶颈特征的说话人验证系统重放攻击检测方法
下一篇:基于感知信任模型的用户隐私等级评估算法研究