首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

合作伙伴的Web挖掘系统研究

第一章 绪论第8-19页
    1.1 合作伙伴的概念第9-13页
        1.1.1 合作伙伴的定义第9-11页
        1.1.2 合作伙伴的确定标准第11-12页
        1.1.3 合作伙伴的寻找方法第12-13页
    1.2 Web挖掘技术概述第13-18页
        1.2.1 Web挖掘的起源第13页
        1.2.2 Web挖掘的定义第13-14页
        1.2.3 Web挖掘的研究方向第14-18页
    1.3 选题的意义第18-19页
第二章 系统的总体设计第19-23页
    2.1 企业Web文档的数据模型第19-20页
    2.2 Web挖掘的实现技术第20-21页
    2.3 系统的总体设计第21-23页
        2.3.1 系统结构第21页
        2.3.2 系统行为第21-23页
第三章 企业Web文档采集器的设计第23-32页
    3.1 企业Web文档的获取方式第23-25页
        3.1.1 统一资源定位器第23页
        3.1.2 超文本传输协议第23-24页
        3.1.3 HTTP GET请求第24-25页
    3.2 文档采集器的设计第25-28页
        3.2.1 文档搜集模块第25-26页
        3.2.2 控制模块第26-27页
        3.2.3 文档发现模块第27-28页
    3.3 文档采集器的实现技术第28-31页
        3.3.1 数据结构第28-29页
        3.3.2 进程间的通信第29-30页
        3.3.3 Web抓取第30-31页
    3.4 总结第31-32页
第四章 企业Web信息抽取第32-51页
    4.1 分词处理第32-38页
        4.1.1 自动分词方法综述第32-33页
        4.1.2 分词方法的评价标准第33-34页
        4.1.3 本文所采用的分词方法第34-38页
    4.2 特征提取第38-47页
        4.2.1 文本特征的概念第38-39页
        4.2.2 一般文本特征项的提取第39-40页
        4.2.3 合作伙伴专有特征项的提取第40-47页
    4.3 Web文档结构化第47-50页
        4.3.1 文档结构化的概念第47-48页
        4.3.2 文档结构化的主要过程第48-49页
        4.3.3 文档结构化的算法描述第49-50页
    4.4 总结第50-51页
第五章 总结与展望第51-53页
    5.1 总结第51页
    5.2 展望第51-53页
致谢第53-54页
参考文献第54-56页

论文共56页,点击 下载论文
上一篇:污染环境中生态学系统的持续生存与绝灭
下一篇:On the Transformation of the Literariness of Translated Literature