首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

科技成果的自动提取与融合

摘要第4-6页
Abstract第6-7页
1 绪论第11-18页
    1.1 研究意义第11-12页
    1.2 信息融合概述第12-16页
        1.2.1 定义第12页
        1.2.2 分类第12-14页
        1.2.3 研究现状第14-15页
        1.2.4 未来发展第15-16页
    1.3 课题背景与设计目标第16-17页
    1.4 论文主要工作内容及结构安排第17-18页
2 相关技术研究第18-31页
    2.1 Web信息抽取第18-23页
        2.1.1 概念第18-19页
        2.1.2 技术分类第19-20页
        2.1.3 评价标准第20-21页
        2.1.4 研究现状第21-23页
        2.1.5 未来发展第23页
    2.2 记录去重技术第23-27页
        2.2.1 相关定义第23-24页
        2.2.2 相似性度量第24-25页
        2.2.3 重复记录的检测第25-26页
        2.2.4 重复记录的清除第26-27页
        2.2.5 记录去重的研究现状第27页
    2.3 其他技术第27-30页
        2.3.1 HTML技术第27-28页
        2.3.2 XML技术第28-29页
        2.3.3 XPath技术第29-30页
        2.3.4 DOM技术第30页
    2.4 本章小结第30-31页
3 科技成果的抽取研究第31-51页
    3.1 问题定义第31-33页
    3.2 相关概念第33-37页
        3.2.1 空间关系第33页
        3.2.2 矩形代数理论第33-34页
        3.2.3 CSS盒子模式第34-36页
        3.2.4 空间连接第36-37页
    3.3 提出方案第37-39页
    3.4 科技成果信息的抽取研究第39-46页
        3.4.1 成果元数据第39页
        3.4.2 构建DOM树第39-40页
        3.4.3 基于空间连接的信息抽取第40-44页
        3.4.4 成果记录的构建第44-46页
    3.5 模拟及分析第46-50页
        3.5.1 模拟实验第46-49页
        3.5.2 算法分析第49-50页
    3.6 本章小结第50-51页
4 相似成果数据的去重与合并研究第51-71页
    4.1 科技成果的分类第51-56页
        4.1.1 问题定义第51-52页
        4.1.2 成果粗分类第52-53页
        4.1.3 成果细分类第53-56页
    4.2 相似重复记录的检测第56-58页
        4.2.1 编辑距离度量相似性第56-57页
        4.2.2 一种新的权重分配方式第57-58页
    4.3 成果记录的合并第58-62页
        4.3.1 成果数据的描述标准化第59-60页
        4.3.2 成果记录的合并第60-61页
        4.3.3 算法描述第61-62页
    4.4 实验与分析第62-70页
        4.4.1 成果分类实验第62-65页
        4.4.2 成果记录合并实验第65-70页
        4.4.3 算法分析第70页
    4.5 本章小结第70-71页
5 总结与展望第71-73页
    5.1 工作总结第71页
    5.2 工作展望第71-73页
参考文献第73-79页
攻读学位期间主要的研究成果第79-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:SSL服务器集群系统性能优化的研究
下一篇:基于免疫粒群路径优化的网络拥塞控制研究