首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向中文网页的信息抽取关键技术研究与实现

摘要第5-6页
Abstract第6页
第1章 绪论第11-14页
    1.1 课题背景第11-12页
    1.2 本文研究内容第12-13页
    1.3 本文的组织第13-14页
第2章 相关技术的研究综述第14-30页
    2.1 信息抽取介绍第14-16页
    2.2 自由文本信息抽取技术第16-18页
    2.3 命名实体识别技术第18-21页
    2.4 web半结构化信息抽取技术第21-25页
    2.5 数据集成第25-29页
    2.6 本章小结第29-30页
第3章 基于自然语言处理的自由文本信息抽取第30-42页
    3.1 自由文本信息抽取实现概述第30-31页
    3.2 中文分词与词性标注第31页
    3.3 命名实体识别第31-35页
    3.4 语义规则的组成第35-38页
    3.5 自由文本抽取规则归纳第38-40页
    3.6 本章小结第40-42页
第4章 基于包装器归纳的半结构化文本信息抽取第42-49页
    4.1 包装器归纳方法概述第42-43页
    4.2 训练集标注第43-44页
    4.3 抽取规则设计第44-46页
    4.4 包装器归纳算法第46-48页
    4.5 本章小结第48-49页
第5章 企业注册信息抽取系统设计与实现第49-71页
    5.1 企业注册信息抽取系统框架第49-50页
    5.2 网页URL收集第50-54页
    5.3 网页段落筛选第54-57页
    5.4 数据语义集成第57-59页
    5.5 系统实现第59-63页
    5.6 实验结果与分析第63-69页
        5.6.1 自由文本信息抽取结果与分析第64-65页
        5.6.2 半结构化文本信息抽取结果与分析第65-67页
        5.6.3 综合方法信息抽取结果与分析第67-69页
    5.7 本章小结第69-71页
第6章 总结与展望第71-73页
    6.1 总结第71-72页
    6.2 展望第72-73页
参考文献第73-77页
攻读硕士学位期间主要的研究成果第77-78页
致谢第78-79页

论文共79页,点击 下载论文
上一篇:校园电子商务系统的设计与实现
下一篇:云计算环境下虚拟机迁移机制研究