首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于特定领域对象级垂直搜索中的对象抽取问题的研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-15页
    1.1 选题背景和研究意义第10-11页
    1.2 国内外现状综述第11-13页
    1.3 论文研究内容和结构安排第13-15页
第二章 对象级搜索和Web信息抽取技术的综述第15-30页
    2.1 对象级搜索引擎第15-21页
        2.1.1 聚焦爬虫第15-17页
        2.1.2 对象集成第17-18页
        2.1.3 对象排序第18-21页
    2.2 web信息抽取技术研究综述第21-29页
        2.2.1 Web信息抽取技术的分类第21-26页
        2.2.2 Web信息抽取技术的比较第26-28页
        2.2.3 Web信息抽取的评价指标第28页
        2.2.4 Web信息自动抽取存在的问题第28-29页
    2.3 本章小结第29-30页
第三章 简单树匹配算法的改进第30-48页
    3.1 模板分类第30-40页
        3.1.1 URL链接分类第30-33页
        3.1.2 网页相似度分类第33-40页
    3.2 相似度算法性能比较第40-43页
    3.3 简单树匹配算法存在的问题第43-45页
    3.4 简单树匹配算法的改进第45-47页
        3.4.1 改进的策略第45-46页
        3.4.2 改进前后测试结果分析第46-47页
    3.5 本章小结第47-48页
第四章 RoadRunner算法研究与改进第48-61页
    4.1 RoadRunner算法的前期研究第48-54页
        4.1.1 网页规范化第48-51页
        4.1.2 RoadRunner算法的背景知识第51-54页
    4.2 RoadRunner算法分析第54-57页
        4.2.1 数据域失配第54-55页
        4.2.2 可选项第55-56页
        4.2.3 迭代器第56-57页
    4.3 属性标注和改进第57-59页
    4.4 改进前后对比分析第59-60页
    4.5 本章小结第60-61页
第五章 对象抽取系统实现与分析第61-71页
    5.1 对象级搜索引擎的整体架构第61-62页
    5.2 对象抽取系统的具体设计与实现第62-68页
        5.2.1 模板分类模块第62-66页
        5.2.2 对象抽取模块第66-68页
    5.3 系统运行测试结果和分析第68-70页
    5.4 本章小结第70-71页
第六章 总结第71-72页
    6.1 结论第71页
    6.2 后续工作第71-72页
致谢第72-73页
参考文献第73-77页

论文共77页,点击 下载论文
上一篇:东航上海营销部办公管理系统设计与实现
下一篇:汇鸿股份办公自动化系统的设计和实现